软件介绍
网页表格数据采集助手是一款表格采集工具,可以为用户将网站上的表格以excel的格式储存到本地,当然也可以实用纯文本,这个能够根据个人需要进行设置。
软件介绍
可以采集单页的规则的和不规则的表格,还可以定时自动连续不断的采集指定网站的表格,而且可以指定采集需要的字段内容,采集后的内容既可以保存为EXCEL软件能够读取的文件格式,也能保存为纯文本的保留原表格样子的表格。
使用方法
1、首先在地址栏输入待采集的网页地址,如果待采集网页已经在IE类浏览器中打开了,那么软件的网址列表中
将自动会加入此地址的,你只要下拉选择一下就会打开了。
2、再点击抓取测试按钮,看看网页源码及该网页中所含的表格数量,网页源码在软件下面的文本框中显示,网
页中所含的表格数及表头信息在软件左上角列表框中显示。
3、从表格数列表中选择你要抓取的表格,此时表格左上角第一格文字将显示在软件的表格左上角第一格内容
输入框中,表格所含字段(列)将显示在软件左侧的中间列表中。
4、再选择你要采集的表格数据的字段(列),如果不选择,将全部采集。
5、选择你是否要抓取表格的表头行,保存时是否显示表格线,如果网页表格中有字段有链接,你可以选择是否
包含链接地址,如果有且要采集其链接地址,那么你不能同时选择包含表头行。
6、如果你要采集的表格数据只有一个网页,那么你现在就可直接点击抓取表格抓取了,如果前面不选择包含表
格线,表格数据将以CVS格式保存,此格式可用微软EXCEL软件直接打开转为EXCEL表格,如果前面选择包含表
格线,表格数据将以TXT格式保存,可用记事本软件打开查看,直接具有表格线,也很清晰。
7、如果你要采集的表格数据有连续多个页面,并且你都想将其采集下来,那么,请再设置程序采集下一页及后
续页面的方式,可以是根据链接名打开下页,链接名称几乎大部分页面都是“下一页”,你看页面,找到后
输入即可,如果网页没有下一页链接,但是网址中包含页数,那么你也可选择根据网址中的页数打开,你可
以选择从前到后,如从1页到10页,也可选择从后到前,如从10页到1页,在页数输入框中输入即可,但此时
网址中代表页数的位置要用“(*)”代替,否则程序将不认识。
8、再选择是定时采集或等待网页打开并加载结束后立即采集,定时采集是程序根据一个设定的很小的时间间隔
去判断打开的页面中是否有你要的表格,有就采集,而网页加载后采集是只要是要采集的网页已经打开了,
程序就会立即进行采集,两者各有特色,看需要选择。
9、最后,就是你点击一下抓取表格按钮,就可以泡杯咖啡逍遥去了!
10、如果是你已经比较熟悉了你要采集的网页的信息,而且要采集指定表格的所有字段,你也可以输入需要的一
些信息后,不经过抓取测试等操作,直接点击抓取表格的。
网友评论