FAQ


FAQ

Crawlab 是什么?

Crawlab 是一个开源的网络爬虫管理平台。它的设计目标是帮助用户更轻松地创建、管理和监控网络爬虫任务。Crawlab 提供了一个用户友好的图形界面,使用户可以通过简单的操作来配置爬虫任务、设置爬取规则、监视爬取状态以及查看爬取结果。

您可以查看 介绍章节 进行更多了解。

Crawlab 为什么可以执行不同编程语言和框架的爬虫?

Crawlab 执行爬虫任务是基于 Shell 命令。因此,如果环境允许,理论上能支持 Shell 命令的爬虫都可以在 Crawlab 中运行。

爬虫中的 执行命令参数 拼接起来就是爬虫任务实际的 Shell 命令。例如,某个爬虫的 执行命令python main.py ,参数为 spider1,那么爬虫任务的 Shell 命令就为 python main.py

为什么拉取 Crawlab 总是 v0.6.0 版本,而不是最新版本?

对于中国国内用户,很有可能您配置了阿里云镜像代理,请使用其他镜像代理,例如腾讯云镜像代理open in new window

Crawlab 支持 Scrapy 吗?

Crawlab 支持 Scrapy,而且有内置的 Pipeline 可以使用,只需要在 settings.pyITEM_PIPELINS 中加入 crawlab.CrawlabPipeline 即可集成。

详情请参考 爬虫集成

Crawlab 支持 Selenium 吗?

Crawlab 支持 Selenium 爬虫,详情参考 Selenium 爬虫集成