您所在的位置：首页 > 电脑软件 > 网络软件 > 网络辅助 > XPath2Doc通用网站数据采集及Doc生成工具下载 v1.0.0.0绿色版

XPath2Doc通用网站数据采集及Doc生成工具下载 v1.0.0.0绿色版

XPath2Doc下载-XPath2Doc通用网站数据采集及Doc生成工具下载 v1.0.0.0绿色版

软件类别：网络辅助
软件语言：中文
软件版本：v1.0.0.0绿色版
软件大小：14.8MB
运行环境：WINDOWS
软件评级：
更新时间：2022-04-17
相关链接：Home Page

360检测百度检测金山检测腾讯检测

网络辅助相关软件

手机版最新应用

游戏
软件

人气网络辅助

八爪鱼采集器

八爪鱼采集器破解版下载(附使用教程)-八爪鱼采集器破解版吾爱破解 v8.1.22

下载
cisco packet tracer8.0中文破解版

packet tracer8.0汉化版|cisco packet tracer8.0汉化破解版下载附汉化文件

下载
思科模拟器中文破解版

思科模拟器汉化版下载-思科模拟器中文破解版附汉化包

下载
爬山虎采集工具

爬山虎采集器绿色破解版下载 v2.1.4

下载
HttpCanary黄鸟抓包

下载
Screaming Frog SEO Spider 14破解版

Screaming Frog SEO Spider 14破解版(网络爬虫工具) v14.0下载[网盘资源]

下载
HTTP Debugger Pro

HTTP Debugger Pro汉化破解版下载 v8.2(附注册机)

下载
草料二维码生成器电脑版

下载
Connectify Hotspot怎么破解

Connectify Hotspot 2018中文破解版下载(含破解补丁)

下载
Charles Proxy怎么破解

Charles Proxy(抓包工具)汉化破解版下载 v4.2.7附破解补丁

下载

人气游戏
人气软件

宝贝你听我解释1

宝贝你听我解释

下载：7515

立即下载

1
火影战记末日版破解版2

火影战记末日版破解版

下载：4827

立即下载

2
夏日狂想曲中文版3

夏日狂想曲中文版

下载：3861

立即下载

3
露奈的药店4

露奈的药店

下载：3408

立即下载

4
超级步兵无限钻石无限金币5

超级步兵无限钻石无限金币

下载：1966

立即下载

5
像素少女6

像素少女

下载：1688

立即下载

6
原神版iwanna7

原神版iwanna

下载：1281

立即下载

7
虫虫助手8

虫虫助手

下载：1187

立即下载

8
悟饭游戏厅9

悟饭游戏厅

下载：1154

立即下载

9
双人游戏10

双人游戏

下载：1033

立即下载

10

新上架电脑软件

网易木木安卓模拟器

网易木木安卓模拟器下载|网易MuMu安卓模拟器下载 V2.3.11

下载
Acrobat Pro DC 2022怎么破解

Acrobat Pro DC 2022破解版下载-Acrobat Pro DC 2022中文破解版下载 v2022.001.20085附安装教程

下载
迅雷vip永久会员

迅雷vip破解版永久会员2021版下载-迅雷vip永久会员2021版下载 v11.2.2.1716绿色免安装版

下载
google earth pro中文破解版

google earth pro破解版下载-google earth pro中文破解版下载 v7.3.4.8428附使用教程

下载
pdffactory pro 8注册码

pdffactory pro 8注册码(附使用教程-pdffactory pro名称和序列号下载

下载
酷我音乐电脑版2021

酷我音乐pc破解版永久免费版-酷我音乐破解版vip破解电脑版2021下载 v9.1.1.4免安装绿色版

下载
快音电脑版

快音电脑版下载|快音听歌赚钱PC客户端下载 v3.13.2

下载
荐片播放器

荐片播放器-荐片影视电脑版下载 v4.2.00官方版

下载
coreldraw2021中文破解版

cdr2021中文破解版下载-coreldraw2021破解版下载永久使用 v23.0直装版(附安装教程)

下载
整点视频

整点视频电脑版下载|整点视频免费版PC版 v1.4.0

下载

详细介绍

XPath2Doc是一款通用网站数据采集及Doc文档生成工具，它的的作用是半自动采集网页数据并生成DOC或DOCX文档文件，支持企查查和天眼查配置文件，你可以通过配置文件修改里面的设置参数，使用时需要先注册，支持升级程序、操作演示等功能。用户通过XPath2Doc需要手动登录，然后点击采集按钮就能够将网页中的内容采集生成doc文件。能够为用户的工作提供极大的便利，非常方便实用，欢迎需要的朋友来本站免费下载使用！~

XPath2Doc

工作原理

网页的每个元素，都可以表示成为XPath语句，所以我们可以读取浏览器打开的网站页面源代码，通过我们这个语句得到网页元素中的文本。
这个语句的获取办法：
通常我们可以使用谷歌的Chrome浏览器打开网站页面，按F12调出开发者工具界面，在ELements选项卡下，随着鼠标的移动可以看到网页内容被阴影覆盖，点开三角符号，可以更进一步定位准确的位置，直到找到最终需要的数据位置。在找到的文本上点鼠标右键，在弹出的菜单中，选择Copy-Copy XPath，然后粘贴到记事本即可得到需要的语句。
这里需要说明一点：如果拷贝出来的语句中有/tbody会影响采集，程序内部对此问题进行了处理，但可能会在某些特殊情况下还是会影响数据采集，可以手工去掉。

运行环境

Windows7 Sp1操作系统请安装下面的组件（重要：VC库如果不安装，本程序无法启动）：
VC2017往上
.net framework 4.5.2
在Windows10系统下上述组件一般自带，不需要单独安装。Windows10 1903运行通过。
不支持Windows XP操作系统。

操作说明

1、本程序工作需要三个配置文件：General.ini，自定义.ini，自定义模板.docx。后两个文件名自己定义。
General.ini文件中定义了INI文件和Docx模板文件的存放目录，可以不填，默认是程序所在目录。
自定义.ini、自定义模板.docx是软件使用者自己创建的网页采集这个语句及最后生成文件所用的Docx模板，具体设置方法请看ini文件中的说明。注意，Docx模板文件中的“@<#0001#>@”之类的字符是在INI文件中定义的用于替换网页采集内容的标记字符串。ini文件中定义了替换关键字的前后缀和模板文件名。
2、使用本程序前，请先建立好你自己的INI配置文件和Docx模板文件。（具体可以参见附带的企查查、天眼查两个配置文件和起诉书模板）
需要说明的是，模板文件支持对文档的不同部分使用不同的网址进行采集，注意Url的设置。
使用方法
启动程序--选择模板--点击采集数据按钮旁边的黑色三角符号，点开下拉菜单，点击需要采集的部分。等候浏览器加载网页完毕，手工输入需要查询的内容，点击查询，找到数据的具体页面，然后点击采集数据按钮，观察右侧的列表中是不是已经得到需要的数据。继续点开下拉菜单，选择下一个需要采集的部分，如果网址发生了变化要等候浏览器加载完毕，找到需要的数据页面。点击采集数据按钮观察右侧列表中是不是得到了第二部分的数据。如此反复，直到数据全部采集完毕。
如果前后两部分的网址相同，在点击下一部分的下拉菜单之前，要先在浏览器中重新查询新的数据，等新数据页面出来之后在点击下拉菜单选择下一部分进行采集。（网址相同的情况下，点击下一部分会直接从网页取数据，如果浏览器没有换页面，数据就错了。）如果某个部分需要重新采集，请先点击下拉菜单中的该部分名称，然后点击采集按钮重复采集该部分（此时可以随意改变浏览器的数据页面，得到的就是不同公司数据）。
列表中采集得到的数据结果如果有偏差，可以单击自行修改。语句如果有什么错误，也可以自己修改看测试结果（XPath语句在修改后会立即重新抓取浏览器的数据，所以浏览器最好是有效数据页面），在程序中修改的这个语句，不会保存到INI文件中，请自行手工保存。
如果列表中数据无误，预览窗口中的Docx模板内容也正确，则可以点击创建文档按钮，填写要生成的文件名，本软件会使用抓取到的网页数据替换模板中的索引字符串，自动生成Docx文档。
需要说明的是，右下角的Docx预览窗口不能完整的支持Word文档，对不标准的文档可能会出现文本缺失或者错位现象。遇到这种情况，可以忽略，或者将模板文件改成规范的文本格式（单倍行距）。