所以我练习刮刮,我遇到了这样的事情:
<div class="profileDetail">
<div class="profileLabel">Mobile : </div>
021 427 399
</div>
我需要 <div>
标签之外的数字:
我的代码是:
num = soup.find("div",{"class":"profileLabel"}).text
但是它的输出是 Mobile :
只是它是 <div>
标签内的文本而不是它外面的文本 .
那么我们如何在 <div>
标签之外提取文本?
2 回答
我会创建一个可重用的函数来通过标签获取值,通过
text
找到标签并获取next sibling:用法:
尝试使用
soup.find("div",{"class":"profileLabel"}).next_sibling
,这将获取下一个元素,可以是bs4.Tag
或bs4.NavigableString
.bs4.NavigableString
是你在这种情况下试图得到的 .示例: