好文档 - 专业文书写作范文服务资料分享网站

58信息采集器如何使用

天下 分享 时间: 加入收藏 我要投稿 点赞

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器如何使用

58同城是目前国内分类信息网站中最为常见的一个,是很多要采集分类信息网站朋友的首要选择。58同城上有很多信息,主要包括房产、招聘、黄页、团购、交友、二手、宠物、车辆等,这些信息采集下来有很多用途,比如HR可以采集招聘信息,从而为自己寻找合适的人才提供帮助,又比如采集黄页,可以清楚的了解一些行业的公司情况。下面为大家介绍使用八爪鱼采集器采集58信息的方法。 采集网站:

http://sz.58.com/ershouche/0/pn2/?PGTID=0d30001d-0000-4a76-5430-9a92493cac3e&ClickID=94

使用功能点:

? 创建循环翻页 ? 分页列表信息采集 ? Ajax点击

相关采集教程:

美团商家信息采集 赶集招聘信息采集 百姓网商家采集

八爪鱼·云采集服务平台

www.bazhuayu.com

步骤1:创建采集任务 1)进入主界面,选择“自定义模式”

58信息采集器使用步骤图1

2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图2

步骤2:创建翻页循环

1)将页面下拉到底部,鼠标点击“下一页”按钮。然后在右侧的操作提示框中,选择“循环点击下一页”

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图3

步骤3:提取二手车信息

1)移动鼠标,选中页面里的第一条二手车相关信息。选中后,红框内的底板会变成绿色,其中的适配信息字段会变为红色底色。然后在右侧的操作提示框中,选择“选中子元素”

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图4

2)接着选择“选中全部”

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图5

3)然后鼠标点中字段旁边的编辑标识,可以对提取字段的自定义命名,点中旁边的删除标识可以删除不需要的字段。

58信息采集器使用步骤图6

步骤4:Ajax点击

1)字段修改完成以后,就可以在右边的提示框中选择“采集以下数据”。

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图7

2)之后选择“保存并开始采集”并选择启动本地采集。可以看到提取数据速度不是很快,所以要在之前设置的规则流程中设置Ajax加载。

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图8

3)首先,打开右上流程按钮

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图9

4)然后鼠标选中左边规则中的“点击翻页”,在左边的高级选项中点开下拉页面,在“AJax加载”一项中勾选AJax加载数据,超时2秒。

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图10

5)注:AJAX即延时加载、异步更新的一种脚本技术,通过在后台与服务器进行少量数据交换,可以在不重新加载整个网页的情况下,对网页的某部分进行更新。

表现特征:

1.点击网页中某个选项时,大部分网站的网址不会改变; 2.网页不是完全加载,只是局部进行了数据加载,有所变化

步骤5:数据采集及导出

1)Ajax设置完成之后,再重新启动本地采集

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图11

2)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出这里我们选择excel作为导出为格式,数据导出后如下图

八爪鱼·云采集服务平台

www.bazhuayu.com

58信息采集器使用步骤图12

相关采集教程:

顺企网企业信息采集:http://www.bazhuayu.com/tutorial/hottutorial/qyxx/shunqiwang 114黄页企业数据采集:http://www.bazhuayu.com/tutorial/hottutorial/qyxx/114huangye 白鲸社区企业信息收集:http://www.bazhuayu.com/tutorial/hottutorial/qyxx/bjsq 搜房网房源采集:http://www.bazhuayu.com/tutorial/hottutorial/fangyuan/soufang 链家爬虫:http://www.bazhuayu.com/tutorial/hottutorial/fangyuan/lianjia 赶集网信息采集:http://www.bazhuayu.com/tutorial/hottutorial/fangyuan/ganji

八爪鱼·云采集服务平台

www.bazhuayu.com

生活服务信息采集:http://www.bazhuayu.com/tutorial/hottutorial/shfw 点评数据采集:http://www.bazhuayu.com/tutorial/hottutorial/shfw/xfdp

分类信息采集教程:http://www.bazhuayu.com/tutorial/hottutorial/shfw/fenleixinxi

八爪鱼——70万用户选择的网页数据采集器。

1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。

2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。

3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。

4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。

58信息采集器如何使用

八爪鱼·云采集服务平台www.bazhuayu.com58信息采集器如何使用58同城是目前国内分类信息网站中最为常见的一个,是很多要采集分类信息网站朋友的首要选择。58同城上有很多信息,主要包括房产、招聘、黄页、团购、交友、二手、宠物、车辆等,这些信息采集下来有很多用途,比如HR可以采集招聘信息,
推荐度:
点击下载文档文档为doc格式
0k26m3wh2e9kfa2517te4mn0g1mmp000jnu
领取福利

微信扫码领取福利

微信扫码分享