xpath

2022-10-18

1.安装

    1. 安装c++budildtools
    2. 使用该
    3. 搜索并下载
    4. lxml
    5. twisted
    6. scrapy
    7. 使用cmd打开到下载文件的目录输入pip install {文件名}

2.xpath简介

xpath可以使用路径表达式在xml和html中导航

xpath包含标准函数库

xpath是w3c标准的主要元素,并且xquery和xpointer都构建 xpath表达之上

3.xpath语法

xpath某个标签的路径可以在elements(dom和样式查看器)中复制

4.在python中使用xpath

import requests
from scrapy import selector
r = requests.get('https://www.88ys.cc/ribendongman/201901/56106.html')
r.encoding = 'utf-8'
html = r.text
sel = selector(text=html)
tag = sel.xpath('/html/body/div[4]/div[1]/div[2]/dl/h1/text()').extract()#/text()只显示标签里的内容
print(tag)#返回<class 'list'>

 

《xpath.doc》

下载本文的Word格式文档,以方便收藏与打印。