当我尝试使用Stanford-NLP和CoreNLP分析文本时,性能非常差 . 从CNN.com处理文档大约需要30秒 .
我的代码基本上创建了一个StanfordCoreNLP的单个实例,其配置如下:
annotators = tokenize,ssplit,pos,lemma,ner,parse,dcoref sutime.binders = 0
当我禁用“ner,parse,dcoref”时,性能非常快 . 由于我需要获取语义图,我想知道是否有一种方法可以优化性能或另一种方法来获取语义图来检索诸如Direct Object,Noun Subject等内容 .
1 回答
解析和共参考解析通常很慢,但遗憾的是,如果不运行
parse
和dcoref
注释器,就无法在CoreNLP中的语义图中获取主题和对象信息 . 也就是说,斯坦福CoreNLP正在积极发展并且随着时间的推移变得越来越快 .