八爪鱼采集器
八爪鱼采集器是一款专业的网页数据采集软件,使用八爪鱼采集器可以快速的采集各种网页的内容,操作简单,以自主开发的分布式系统为核心,可以在短时间采集到大量的数据。
1. 金融数据,如季报,年报,财务报告, 包括每日最新净值自动采集;
2. 各大新闻门户网站实时监控,自动更新及上传最新发布的新闻;
3. 监控竞争对手最新信息,包括商品价格及库存;
4. 监控各大社交网站,博客,自动抓取企业产品的相关评论;
5. 收集最新最全的职场招聘信息;
6. 监控各大地产相关网站,采集新房二手房最新行情;
7. 采集各大汽车网站具体的新车二手车信息;
8. 发现和收集潜在客户信息;
9. 采集行业网站的产品目录及产品信息;
10. 在各大电商平台之间同步商品信息,做到在一个平台发布,其他平台自动更新。
1.操作简单
操作简单,完全可视化图形操作,无需专业it人员,任何会使用电脑上网的人都可以轻松掌握。
2.云采集
采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。
3.拖拽式采集流程
模拟人的操作思维模式,可以登陆,输入数据,点击链接,按钮等,还能对不同情况采取不同的采集流程。
4.图文识别
内置可扩展的ocr接口,支持解析图片中的文字,可将图片上的文字提取出来。
5.定时自动采集
采集任务自动运行,可以按照指定的周期自动采集,并且还支持最快一分钟一次的实时采集。
6.2分钟快速入门
内置从入门到精通所需要的视频教程,2分钟就能上手使用,另外还有文档,论坛,qq群等。
7.免费使用
它是免费的,并且免费版本没有任何功能限制,你现在就可以试一试,立即下载安装。
1、启动八爪鱼采集器,需要先登录才能使用各项功能。大家直接点击【免费注册】按钮注册一个帐号。
2、进入八爪鱼软件页面后,点击【快速开始】= 【新建任务】,打开新建任务界面
3、选择任务组(或者新建一个任务组),输入任务名字和描述= 点击下一步
4、进到流程配置页面= 往流程设计器中拖入一个打开网页的步骤
5、选中打开网页步骤= 输入页面url= 点击保存
接下来,我们就要配置采集规则了,首先点击软件下方网页上要采集的数据
6、之后会出现一个选择对话框,这里我们选择‘提取这个元素的文本’
7、这样系统会自己添加一个‘提取数据’步骤,这样,一个数据点的采集规则就设置完成,继续点击网页上的其他要采集的数据点,并且选择‘提取这个元素的文本’,配置其他数据点的采集设置。所有数据点都配置完成后,修改一下每个数据点的名称,这样采集流程就配置完成了。
保存之后,点击下一步= 下一步= 选择检查任务
8、打开本地采集页面,点击启动按钮,启动本地采集,检查任务运行的效果,流程运行后采集到的数据将会在界面下方的表格中显示,从表格中的数据可以看到,我们想要的数据已经成功的采集下来。
这就是最简单的采集单个网页的整个流程。