Xpath一次从子节点和当前节点中选择文本-Java 学习之路

我正在使用scrapy，我到了这一点，我想从列表中提取具有以下HTML结构的文本：

u'<div id="someId">'
u'<p><strong>Text1:</strong> next to text 1</p>'
u'<p><strong>Text2:</strong> next to text 2</p>'
u'<p><strong>Text3:</strong> next to text </p>'
u'</div>'

所以我想得到的文字：

Text1：text1旁边的Text2：text2旁边的Text3：text3旁边

我想尽可能地用XPath提取文本，我一直在尝试使用一些XPath谓词而不解决我的问题 .

同

response.xpath('//*[@id="someid"]/p/text()').extract()

我没有得到P中强标签的文字

任何帮助将不仅仅是赞赏 .

1 回答

3
你很亲密：
```
'//*[@id="someid"]/p//text()'
```
这将获得 list ，其中包含 p 标签内的所有文本 .
回复于 2024-05-04T08:20:17+08:00

Xpath一次从子节点和当前节点中选择文本

1 回答

相关问题