88软件园 > 软件下载 > 应用工具 > 站长工具 > 懒人采集器 v3.2.2.0 免费版

懒人采集器 v3.2.2.0 免费版

软件大小:69MB

软件语言:简体中文

软件授权:免费版

软件类别:站长工具

更新时间:2022-04-26

官方网站:www.nokia88.com

应用平台:/Win8/Win7/WinXP

软件等级:

  • 软件介绍
  • 软件截图
  • 其他版本

懒人采集器免费版是一款功能强大并且实用的网页数据采集工具。这款软件具有零门槛、多引擎、多功能这几个特点。该软件能够让一个不懂网络爬虫技术的人,轻松的采集网络信息,适合99%的网站,同时它还能够智能的避免获得重复的数据。支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中。感兴趣的朋友快来下载吧。

软件特色:

1、适用各种网站 :能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站。

2、多引擎,高速稳定:内置高速浏览器引擎,还可以切换为HTTP引擎模式运行,采集数据更加高效。还内置了JSON引擎,无需分析JSON数据结构,可视化选取JSON内容。

3、零门槛:不懂网络爬虫技术,会上网,就会采集网站数据。

软件功能:

1、可视化向导

所有采集元素,自动生成采集数据。

2、计划任务

灵活定义运行时间,全自动运行。

3、多引擎支持

支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎。

4、智能识别

可自动识别网页列表、采集字段和分页等。

5、拦截请求

自定义拦截域名,方便过滤站外广告,提高采集速度。

6、多种数据导出

可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等。

亮点介绍:

1、软件操作简单,可通过鼠标点击的方式轻松选取要抓取的内容;

2、支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化使浏览器采集也可以高速运行,甚至可以快速转换为HTTP方式运行,享受更高的采集速度!而在抓取JSON数据时,同样可以使用浏览器可视化方式,通过鼠标点选需要抓取的内容,完全不需要去分析JSON数据结构,使非网页专业设计人士也可以轻松抓取需要的数据;

3、不用分析网页请求和源代码,却支持更多的网页采集;

4、先进的智能算法,可以一键生成目标元素XPATH、自动识别网页列表、自动识别分页中的下一页按钮……

5、支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中。

常见问题:

1、采集时怎样避免重复到重复数据?

方法很简单,我们希望哪一个字段内容不允许出现重复,只要点击该字段表头上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了

2、如何手动生成字段?

点击“增加字段”按钮

点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可

当点击的是网页链接时,会提示是否用时要抓取链接地址

如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否,这里我们点“是”

系统会自动生成标题和链接地址字段,并在字段列表中显示出提取到的字段内容,当点击底部表格字段标题时,会在网页上以黄色背景高亮显示出匹配的内容。

如何还有标记列表中的其他字段,点击新增字段,重复以上操作即可。

懒人采集器 v3.2.2.0 免费版软件截图
  • 2