徐代龙的技术专栏 Android and Python Coder

Python爬虫利器之-Xpath helper 谷歌浏览器插件

2017-12-18
SnakeSon

阅读:


介绍:

一款很实用的谷歌浏览器Xpath 解析工具,通过浏览器在线解析工具可以省去很多重复运行,等待的时间。总之,就是能够很直观的查看你要解析到的结果

工具截图

黑色的Xpath helper.png

功能

google插件XPath Helper可以支持在网页点击元素生成xpath,整个抓取使用了xpath、正则表达式、消息中间件、多线程调度框架(参考)。xpath 是一种结构化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。

如果我们要查找某一个、或者某一块元素的xpath路径,可以按住shift,并移动到这一块中,上面的框就会显示这个元素的xpath路径,右边则会显示解析出的文本内容,并且我们可以自己改动xpath路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的xpath语句是否书写正确。

插件下载

一般的现在是翻墙不了了,所以我们直接去谷歌浏览器插件网进行插件的下载:Chrome插件网 下载的CRX文件.png

安装

下载下来,我们进行安装,直接把谷歌浏览器打开, 输入:chrome://extensions/

直接把文件拖进去,然后就会让我确实是否要安装插件。

扩展程序.png

这样我们就把插件安装好了

插件的使用

1.在chrome浏览器安装好xpath helper插件后,打开某个网页(以搜狐为例)拷贝目标页面元素的XPATH,如下图所示: xpath打开页面.png

2.点击 Ctrl + Shift + X 激活 XPath Helper 的控制台,然后您可以在 Query 文本框中输入相应 XPath 进行调试了,提取的结果将被显示在旁边的 Result 文本框中,如下图所示:

黑框.png

步骤

1。打开一个新的标签,并导航到你最喜欢的网页。 2。按Ctrl-Shift键-X以打开XPath辅助控制台。 3。按住Shift键鼠标在页面上的元素。查询框会不断更新,以显示鼠标指针下面的元素充分XPath查询。结果框其右侧将显示评价结果的查询。 4。如果需要的话,可以直接在控制台编辑XPath查询。在结果框中将立即反映任何变化。 5。再次按Ctrl-Shift键-X关闭控制台


Comments

Content