首页 文章

Word2Vec和Glove矢量是否适合实体识别?

提问于
浏览
3

我正在进行命名实体识别 . 我评估了库,例如MITIE,Stanford NER,NLTK NER等,它们是基于传统的nlp技术构建的 . 我还研究了深度学习模型,如word2vec和Glove向量,用于表示向量空间中的单词,它们很有趣,因为它们提供了关于单词上下文的信息,但是特别针对NER的任务,我认为它不太适合 . 由于所有这些矢量模型都创建了词汇和相应的矢量表示 . 如果任何单词未能出现在词汇表中,则无法识别 . 假设命名实体很可能不存在,因为它们不受语言约束 . 它可以是任何东西 . 因此,如果任何深度学习技术必须在这种情况下有用,那么通过使用标准英语词汇更加依赖于句子结构的那些,即忽略命名字段 . 有没有这样的模型或方法? CNN或RNN可能是它的答案吗?

1 回答

  • 0

    我认为你的意思是某种语言的文本,但该文本中的命名实体可能包含不同的名称(例如来自其他语言)?

    我想到的第一件事是一些半监督学习技术,模型定期更新,以反映新的词汇 .

    例如,您可能希望使用word2vec模型来训练传入的数据,并将可能的NE的字向量与现有的NE进行比较 . 他们的余弦距离应该很近 .

相关问题