Python，正则表达式和html：在线匹配最终标签-Java 学习之路

我对python贪婪/不贪婪的角色感到困惑 .

“给定多行html，返回每行的最终标记 . ”

我认为这是正确的：

re.findall('<.*?>$', html, re.MULTILINE)

我很烦，因为我期待一个单独的标签列表，如：

"</html>", "<ul>", "</td>".

我的口袋参考说 *? wil "match 0 or more times, but as few times as possible."

那么为什么我会得到“贪婪”的比赛，比如一些（但不是全部）比赛中有多个？

1 回答