我需要在divtestimonial1 div中提取这个内容我使用以下regEx,但它只返回第一行
Regex r = new Regex("<div([^<]*<(?!/div>))");
<div class="testimonial_content" id="divtestimonial1">
<a name="T1"></a>
<div class="testimonial_headline">%testimonial1headline</div>
<p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span>
</p>
</div>
1 回答
Regular expressions are generally not a good choice for parsing HTML . 您可能最好使用HTML Agility Pack等工具,因此我建议您使用它 .
话虽如此,您可以使用此正则表达式匹配您的特定样本输入:
但它可能会破坏您的真实场景 . Regex和HTML的一个问题是正确检测标签的嵌套等 .