首页 文章

句子级别到文档级别的情绪分析 . 分析新闻

提问于
浏览
1

我需要使用Stanford NLP工具对有关特定主题的新闻文章进行情绪分析 .

这样的工具只允许基于句子的情感分析,而我想提取关于我的主题的整篇文章的情绪评估 .

例如,如果我的主题是Apple,我想知道关于Apple的新闻文章的情绪 .

只计算我文章中句子的平均值是不行的 . 例如,我可能会有一篇文章说“Apple非常擅长这一点,而且就是这样 . 虽然Google产品因这些原因而非常糟糕” . 这样的文章会使用句子的平均分数来产生中性分类,而实际上这是一篇关于Apple的非常积极的文章 .

另一方面,过滤我的句子只包括含有Apple这个词的那些句子会错过“Apple的产品A非常好的文章 . 但是,它缺乏以下关键特征:......” . 在这种情况下,如果我只使用包含单词Apple的句子,则第二句的效果将会丢失 .

有没有一种解决这类问题的标准方法? Stanford NLP是否是实现目标的错误工具?

1 回答

  • 3

    更新:您可能想查看http://blog.getprismatic.com/deeper-content-analysis-with-aspects/

    这是一个非常活跃的研究领域,所以很难找到一个现成的工具来做到这一点(斯坦福CoreNLP至少没有 Build 任何东西) . 一些指示:研究基于方面的情绪分析 . 在这种情况下,Apple将是一个“方面”(不是真的,但可以这样建模) . 安大略麦卡勒姆在麻省大学的工作小组,刘冰冰的UIC小组,康奈尔大学的NLP小组等人都在解决这个问题 .

    如果你想快速修复,我建议从提及Apple及其产品的句子中提取情绪;使用coref(查看斯坦福CoreNLP中的dcoref注释器),这将增加句子的回忆并解决句子问题,如“但是,它缺乏......” .

相关问题