使用XSLT,我试图去掉特定节点中的所有标签,同时保留这些标签之间的空白 .
我给这样的XML:
<text>
<s id="s2"> The patient is a <p id="p22">56-year-old</p> <p id="p28">Caucasian</p> <p id="p30">male</p></s></text>
我想删除所有<s>和<p>标签,以便我在<text>节点中只有英文句子 .
我已经尝试了以下模板,该模板成功删除了所有标记,但如果没有其他字符,它还会删除<p>标记之间的空格 . 例如,我最终会说:“患者是一位56岁的女士”
<xsl:template name="strip-tags">
<xsl:param name="text"/>
<xsl:choose>
<xsl:when test="contains($text, '<')">
<xsl:value-of select="substring-before($text, '<')"/>
<xsl:call-template name="strip-tags">
<xsl:with-param name="text" select="substring-after($text, '>')"/>
</xsl:call-template>
</xsl:when>
<xsl:otherwise>
<xsl:value-of select="$text"/>
</xsl:otherwise>
</xsl:choose>
</xsl:template>
有什么想法吗?谢谢!
1 回答
保留了空格但删除了标签的文本内容正是元素节点的“字符串值”的定义 . 所以你可以简单地使用
(假设
$text
包含<text>
元素节点) . 这也假定你没有在样式表中,因为它会删除各对
</p> <p>
标记之间的仅空白文本节点 .