FAQ

Crawlab 是一个开源的网络爬虫管理平台。它的设计目标是帮助用户更轻松地创建、管理和监控网络爬虫任务。Crawlab 提供了一个用户友好的图形界面，使用户可以通过简单的操作来配置爬虫任务、设置爬取规则、监视爬取状态以及查看爬取结果。

您可以查看介绍章节进行更多了解。

Crawlab 执行爬虫任务是基于 Shell 命令。因此，如果环境允许，理论上能支持 Shell 命令的爬虫都可以在 Crawlab 中运行。

爬虫中的 执行命令 和 参数 拼接起来就是爬虫任务实际的 Shell 命令。例如，某个爬虫的 执行命令 为 python main.py ，参数为 spider1，那么爬虫任务的 Shell 命令就为 python main.py。

对于中国国内用户，很有可能您配置了阿里云镜像代理，请使用其他镜像代理，例如腾讯云镜像代理open in new window。

Crawlab 支持 Scrapy，而且有内置的 Pipeline 可以使用，只需要在 settings.py 的 ITEM_PIPELINS 中加入 crawlab.CrawlabPipeline 即可集成。

详情请参考爬虫集成。

Crawlab 支持 Selenium 爬虫，详情参考 Selenium 爬虫集成。

首先，确认你的定时任务是否已经启用。

如果已启用，很有可能是因为你的时区没有设置为你本地时间，你需要设置环境变量 TZ 为你本地时区，例如 Asia/Shanghai。

Crawlab AI 是 Crawlab 的新产品。它处于早期开发阶段，为用户提供了一个实验智能数据提取的平台。您可以访问 Crawlab AIopen in new window 网站了解更多信息。

# FAQ