任务
任务
任务是 爬虫 触发的进程,能够抓取网站数据、进行特殊操作、提供其他一些功能。它是运行爬虫进程的基本单位。
在 Crawlab 中,您不仅可以一键运行任务,还可以可视化的查看统计数据、实时日志、已抓取数据等任务信息。此外,您还可以设置 Priority
来决定任务的执行顺序。
运行任务
您可以 通过爬虫运行任务,或执行下面的步骤。
- 导航至
任务列表
页面 - 点击左上方的
新建任务
按钮 - 选择
爬虫
及其他信息 - 点击
确认
重新运行任务
- 导航至
任务列表
页面 - 点击右侧的
重新运行
按钮
监控任务
Crawlab 提供任务监控功能,让您能够紧密观察抓取结果数据以及爬虫抓取效率。
查看日志
您可以在 Crawlab 中查看实时日志。
- 导航至任务详情页
- 点击
日志
标签
查看数据
您可以实时查看已抓取数据
- 导航至任务详情页
- 点击
数据
标签
取消任务
如果任务是 待运行
或 运行中
状态,您可以取消它,通过
- 在
任务列表
页面中点击右侧的取消
,或 - 在任务详情页点击导航条上的
取消
按钮