我对Liu BingLiu Bing这本书着迷,我已经实现了一个获得文本方面的小程序 .

我通过Hu搜索了我的文本中的正面和负面单词列表,并使用nltk.tokenizer找到了最接近情感单词旁边的名词或人称代词 . 结果非常有趣,但我正在努力检测否定和背景 .

亚马逊的例子:

“我喜欢辣拉面,但无论出于什么原因,这个东西都会严重烧伤我的肚子,灼烧的感觉不会消失3个小时!不确定它是否 Health ......你可以在沃尔玛购买0.28美元,比亚马逊便宜 . “

我的程序返回一个元组列表(“情绪词”,“方面”,“情绪”) . 1表示积极情绪,0表示负面情绪 .

[(u'love', u'i', 1),
(u'love', u'spicy', 1),
(u'burns', u'thing', 0),
(u'badly', u'stomach', 0),
(u'burning', u'stomach', 0),
(u'sensation', u'stomach', 1),
(u'healthy', u'healthy', 1),
(u'cheaper', u'way', 1)]

似乎该方法可以捕获某些方面,但远非正确 . 此外,我与刘的例子(第23页)相距甚远:

我买了三星相机,我的朋友昨天带了佳能相机 . (2)在过去的一周里,我们都经常使用相机 . (3)Samy的照片不是很好,电池寿命也很短 . (4)我的朋友对他的相机非常满意并且喜欢它的画质 . (5)我想要一台能拍出好照片的相机 . (6)我明天要回来

我真的想改进,以便我可以正确地捕捉方面和情绪 . 我知道这是一个非常普遍的问题,但你能推荐一些包裹并给我读书吗?

最好也非常感谢Alex