当前位置: 首页>>软件下载 >网络工具 >上网辅助 > 爬山虎采集器 v3.0.3.3免费版

爬山虎采集器 v3.0.3.3免费版

360浏览器无法下载资源的解决办法?

点此纠错

情介绍

  爬山虎采集器V2是一款支持99%的网站数据采集的高效网页信息采集软件,爬山虎采集器能生成Excel表格,api数据库文件等内容,帮助你管理网站数据信息,如果您需要对某个指定网页数据进行采集,使用这款软件即可。

爬山虎采集器 v3.0.3.3免费版软件特色

  一键提取数据

  简单易学,通过可视化界面,鼠标点击即可抓取数据

  快速高效

  内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据

  适用各种网站

  能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站

爬山虎采集器 v3.0.3.3免费版功能介绍

  向导模式

  简单易用,轻松通过鼠标点击自动生成

  脚本定时运行

  可按照计划定时运行,无需人工

  独创高速内核

  自研的浏览器内核,速度飞快,远超对手

  智能识别

  对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别

  广告屏蔽

  定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则

  多种数据导出

  支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

爬山虎采集器 v3.0.3.3免费版使用方法

  第一步:输入采集网址

  打开软件,新建任务,输入需要采集的网站地址。

  第二步:智能分析,全程自动化提取数据

  进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。

  第三步:导出数据到表格、数据库、网站等

  运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。

爬山虎采集器 v3.0.3.3免费版常见问题

  问:如何过滤列表中的前N个数据?

  1.有时我们需要对采集到的列表进行过滤,比如过滤掉第一组数据(在采集表格时,过滤掉表格列名)

  2.点击列表模式菜单中的,设置列表xpath

  问:如何抓包获取Cookie,并且手动设置?

  1.首先,使用谷歌浏览器打开要采集的网站,并且登陆。

  2.然后按下 F12,会出现开发者工具,选择 Network

  3.然后按下F5,刷新下页面, 选择其中一个请求。

  4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTP Header。

爬山虎采集器 v3.0.3.3免费版更新日志

  优化导出数据窗口

  XPath文本框新增自动完成、语法高亮功能

  新增导出图片到Excel

  修复分组计划任务的一个问题

  修复其他等问题

您喜欢

需要授予该应用的权限

	  

获取任务信息

允许程序获取当前或最近运行的应用

修改声音设置 修改声音设置信息

连续广播

允许一个程序收到广播后快速收到下一个广播

连续广播

允许一个程序收到广播后快速收到下一个广播

读写系统设置

允许读写系统设置项

唤醒锁定

允许程序在手机屏幕关闭后后台进程仍然运行

访问网络

访问网络连接,可能产生GPRS流量

读取电话状态

访问电话状态

获取WiFi状态

获取当前WiFi接入的状态以及WLAN热点的信息

获取网络状态

获取网络信息状态,如当前的网络连接是否有效

访问外部存储

访问外部存储的权限

写入外部存储

允许程序写入外部存储,如SD卡上写文件

挂载文件系统 挂载、反挂载外部文件系统

录音 录制声音通过手机或耳机的麦克

使用振动 允许振动

改变WiFi状态 改变WiFi状态

改变WiFi多播状态 改变WiFi多播状态

结束系统任务 结束任务通过restartPackage(String)方法,该方式将在外来放弃

显示系统窗口 显示系统窗口

禁用键盘锁 允许程序禁用键盘锁

获取精确位置 通过GPS芯片接收卫星的定位信息,定位精度达10米以内

获取粗略位置 通过WiFi或移动基站的方式获取用户错略的经纬度信息,定位精度大概误差在30~1500米

访问定位额外命令 允许程序访问额外的定位提供者指令

使用蓝牙 允许程序连接配对过的蓝牙设备

蓝牙管理 允许程序进行发现和配对新的蓝牙设备

状态栏控制 允许程序扩展或收缩状态栏

读取系统日志 读取系统底层日志

改变网络状态 改变网络状态如是否能联网

排序系统任务 重新排序系统Z轴运行中的任务

拍照权限 允许访问摄像头进行拍照

读取日程提醒 允许程序读取用户的日程信息

写入日程提醒 写入日程,但不可读取

使用闪光灯 允许访问闪光灯

允许NFC通讯 允许程序执行NFC近距离通讯操作,用于移动支持