我使用斯坦福NLP来检测文本中的主要主题或主题,但如果文本中包含“:”或“'”,则无法检测到它们并且还会打破它周围的文本,例如:如果给定的文本是Avenegers:Infinity战争它给复仇者,无限,战争作为3个单独的主题,但如果文本是复仇者联盟无限战争它被检测为单一主题 .

逃避这些字符是解决这个问题的唯一方法,还是有任何其他方法可以解决这个问题?