手机版
访问手机版
Yx12345下载站用心打造专业的软件下载站
yx12345下载站
当前所在位置:下载首页 > yx12345电脑频道 > 网络工具 > 浏览辅助 >
抓取网页

网页爬虫、抓取网页数据工具_WebHarvy免费版 V6.4.0.191 下载

  • 软件大小:80.2mb
  • 更新时间:2021-12-22
  • 软件语言:英文
  • 所属分类:浏览辅助
  • 软件类型:国外软件
  • 授权方式:免费版
  • 用户评分:评分
  • 运行环境:XP,Win7,Win8,Win10

本地下载http下载地址

软件介绍相关软件

一个好的网站,你是否想把很多文字给抓取下来保存到本地呢?WebHarvy是一款网页爬虫、抓取网页数据工具,使用WebHarvy网页爬虫,您可以轻松地从任何网站抓取文本、HTML、图像、URL和电子邮件,并将抓取的数据保存为各种格式。

界面预览图:

网页爬虫、抓取网页数据工具_WebHarvy免费版

WebHarvy是一个易于使用的可视化网页爬虫、抓取网页数据工具,它可以帮您无限制地从任何网站抓取数据。WebHarvy 可以从网站的多个页面中抓取文本、图像、电话、电子邮件/网站地址等,并将数据以电子表格格式保存到文件或数据库中。

通过WebHarvy网页爬虫您可以直接在网页上选择需要选择的资源,也可以直接将整个网页存储为HTML的格式,从而提取网页里面的所有文本与图标内容,当您复制一个URL地址时,应用默认使用内部浏览器组件打开,可以显示完整的网页,随后您可以开始配合数据抓取的规则。

WebHarvy参数设置界面

SysNucleus WebHarvy允许扩展分析可以自动获取相似链接的列表,复制一个地址就能搜索多个网页内容,不需要编写任何脚本或代码来抓取数据。您将使用WebHarvy的内置浏览器查看网页,您可以选择要点击的数据,WebHarvy自动识别网页中发生的数据方式。所以如果您需要从网页上刮取项目列表(名称,地址,电子邮件,价格等),则不需要执行任何其他选项。

现在WebHarvy 可以从任何网站抓取数据,处理登录、表单提交、导航、分页、类别与关键字。

什么是网页抓取?

网页抓取是将网站显示的数据自动下载到您的电脑或数据库的过程。网页抓取软件可以抓取网站内的多个页面,并自动执行手动复制与粘贴显示数据的繁琐任务。数据平常以电子表格(表格)格式下载。

WebHarvy网页爬虫功能:

1、容易的网页抓取

使用 WebHarvy 的点击式界面可以容易进行网页抓取。不需要编写代码或脚本来抓取数据。您将使用 WebHarvy 的内置浏览器来加载与浏览网站,您可以通过点击鼠标选择要抓取的数据。

2、智能模式检测

WebHarvy 自动识别网页中出现的数据模式。要从网页中抓取项目列表或表格(姓名、地址、电子邮件、价格等),不需要额外的配置。如果数据重复,WebHarvy 会自动抓取它。

3、保存到文件或数据库

刮取的数据可以以多种格式保存。当前版本的 WebHarvy Web Scraping Software允许您将抓取的数据保存为 Excel、XML、CSV、JSON 或 TSV 文件。您还可以将数据导出到 SQL 数据库。

4、处理分页

网站平常会在多个页面中显示产品列表或搜索结果等数据。WebHarvy 可以自动从多个页面抓取与抓取数据。只需指出下一页的链接,WebHarvy 就会自动从所有页面中抓取数据。

5、提交关键词

通过自动向搜索表单提交输入关键字列表来抓取数据。可以将任何数量的输入关键字提交到多个输入文本字段以执行搜索。可以抓取所有输入关键字组合的搜索结果数据。

6、分类抓取

WebHarvy 允许您从指向网站内类似页面/列表的链接列表中抓取数据。这允许您使用单个配置在网站内抓取类别与子类别。

7、常见表达

正则表达式 (RegEx) 可以应用于网页的文本或 HTML 源以抓取匹配部分。这种强大的技术在抓取数据时为您提供了更大的灵活性与控制力。

8、JavaScript 支持

在抓取数据之前在浏览器中运行您自己的 JavaScript 代码。这可用于与页面元素交互、修改 DOM 或调用已在目标页面中实现的 JavaScript 函数。

9、图像抓取

可以下载图像或抓取图像 URL。WebHarvy 可以自动抓取电子商务网站的产品仔细信息页面中显示的多个图像。

10、自动化浏览器任务

WebHarvy 可以容易配置为执行诸如 点击链接、 选择列表/下拉选项、向字段输入文本、 滚动页面、 打开弹出窗口等任务。

WebHarvy网页爬虫特点:

1、支持智能识别方式

2、支持导出捕获的数据

3、支持从多个页面提取

4、直观化的操作界面

5、支持基于关键字的提取

6、支持提取分类

7、支持使用正则表达式提取

WebHarvy网页爬虫基本使用教程:

1、WebHarvy 可让你容易地从网站上抓取数据。

WebHarvy抓取网页教程

2、使用WebHarvy的内置浏览器导航到任何网页。请确保您使用鼠标进行所有点击操作,而不是使用键盘。

打开WebHarvy,用自带的浏览器浏览网页

3、到达包含要抓取的数据的页面后,点击主页菜单的配置面板中的开始按钮。

当要抓取时,点击抓取按钮即可

4、它的功能很强大,你可以通过配置菜单进行细节配置。

此软件只有英文界面。。。

相关软件这里为您精准匹配了一些同类软件下载

  • 抓取网页文字软件

    绿色版 | 你想抓取网页内容吗?你想抓取网页文字吗?现在很多网页都不能拷贝复制文字怎么办?下载网文快存这款免费的抓取网...

  • textify绿色汉化中文版

    绿色版 | 在电脑上您是否遇到过很多网页做了限制无法复制网页上的文字?大部分的应用程序上的文字都不可复制?现在您借助t...

  • teleport ultra中文汉化绿色版

    绿色版 | 您是否想把在线浏览的网页保存到本地?这个行为也叫离线浏览,我想您可能需要一款靠谱的离线浏览器。teleport ...

  • neodownloader绿色中文破解版

    绿色版 | 网页上会有很多图片或者音乐等元素,或许您正在浏览一个图片网站,您想将网页上的所有美图保存到本地,一张张...

下载地址

网页爬虫、抓取网页数据工具_WebHarvy免费版 V6.4.0.191 下载

本地高速下载

1、如果下载地址无法下载,请多试几个下载地址!如何安装与使用方法,请百度一下官方网站,安装方法与使用教程。
2、为保证您可以高速下载,请使用迅雷等下载工具下载。如果下载后出现不能解压,请安装winrar等解压缩包软件!
3、如果您下载的压缩包解压时需要输入解压密码,请输入解压密码(红字):www.yx12345.com
4、本站不提供该软件的破解版,注册码,序列号,破解补丁,注册密钥,激活码,注册机等相关破解信息下载及咨询!