Python怎样获取XPath下的A标签的内容

2025-01-05 07:53:48
推荐回答(3个)
回答1:

1、在浏览器中打开网页。然后//div,就可以找到页面中的所有div了,因为//表示的是任意目录下查找。如图,页面有两个div,所以可以找到两个。

2、要查找类为a的div,可以在div后面用[@class="类名"]来指定,这样没有类名a的div就会被过滤掉,当然,还可以用id,把class改为[@id="id名"]即可。

3、用//,这样div下面的非a标签就会被跳过,直接去找a标签。

4、如果要获取a标签的href,那么可以获取到a标签后用/@href即可获得。

5、如果是获取文本的话,可以用text()这个方法,就会得到a标签里面的内容。

6、斜杠/表示的是获取子元素,比如div下面有两个子元素p,那么//div[2]/p获取的就是第二个div的子元素p。

回答2:

1、首先打开jupyter notebook,在主界面的右边点击New,选择Python3新建一个Python文件:

2、然后首先引入lxml包,定义一段html文本,用etree中和HTML方法导入上述html文本,然后就可以用xpath定位A标签的内容了,定位用的的函数是text方法,最后把结果打印出来即可:

3、最后运行所有的cell中的代码,即可拿到A标签的内容了。以上就是Python获取XPath下的A标签的内容的方法演示:

回答3:

html = `

    hello world

`
# 获取a标签下的文本
xpath("//a/text()") # world
# 获取a标签以及子标签中的内容
xpath("//a//text()") # hello world
# 获取a标签中的连接
xpath("//a/@href") #  www.some.com