软件介绍
懒人采集器破解版是一款十分轻便的采集器,它可以帮助用户们去任何网站上采集自己想要的网页数据,而且还不用用户们拥有编程等其他基础,因此即使是小白用户,也可以轻松进行采集。
软件介绍
懒人采集器是全新一代的浏览器采集,给你不一样的采集体验!它拥有可视化配置、简易创建、无需编程、智能生成等功能,可以让用户了解到数据采集如此简单。
软件特色
1.智能识别
可自动识别网页列表、采集字段和分页等
2.拦截请求
自定义拦截域名,方便过滤站外广告,提高采集速度
3.多种数据导出
可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等
常见问题
1.采集时怎样避免重复到重复数据?
在运行某个采集任务时,如果该任务之前有采集过数据,那么采集前如果没有清空原有数据的话,会以追加的形式将新采集数据添加到本地采集库中,这样就可能出现某些已采集过的数据再次重复采集入库,还有,如果目标网页本身也重复的数据,也可能造成数据重复,那么怎么避免采集的数据出现重复呢?
方法很简单,我们希望哪一个字段内容不允许出现重复,只要点击该字段表头上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了
2.如何手动生成字段?
①点击“增加字段”按钮
②点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可
③当点击的是网页链接时,会提示是否用时要抓取链接地址
④如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否,这里我们点“是”
⑤系统会自动生成标题和链接地址字段,并在字段列表中显示出提取到的字段内容,当点击底部表格字段标题时,会在网页上以黄色背景高亮显示出匹配的内容。
⑥如何还有标记列表中的其他字段,点击新增字段,重复以上操作即可。
网友评论