我正在研究一个需要同时进行词性(POS)标记和情感分析的问题 . 我正在使用Tensorflow并正在考虑Keras .
我有一个大的英语句子数据集,这些句子都标有POS标签和情绪(负面,中立,正面) .
是否有可能训练一个递归神经网络(香草RNN,GRU或LSTM)来学习 both POS标记和情绪分类?当然,在测试期间,我想输入一个句子并让RNN一起生成POS标签和情绪的预测 .
我在考虑以下RNN架构 . 我不确定Tensorflow(我一直在使用)或Keras(我现在才学习)是否可行 . 我之前已经实现了执行一项任务的RNN,而不是两项任务 .
谢谢你的帮助 .
1 回答
一个非常简单的可能适用于POS标记的Keras模型可能如下所示:
我假设各种参数:
hidden_layer_size
:内部重复层的任何维度 .seq_length
:输入序列长度 .nb_words
:词汇量大小,用于单热编码输入,详细说明哪个词的序列位置 .nb_pos_types
:不同可能的POS标签数(对于单热编码标签) .目标是修改这样一个简单的网络,这样它也可以预测情绪(不清楚你的情绪是分数还是类别标签,但我会假设一个类别标签),所以损失函数包括该情绪预测的惩罚期限 .
有很多方法可以做到这一点,但一种常见的方法是从一些早期层“分叉”模型的新轮辐,并让这个轮辐产生额外的预测(通常称为“多任务”或“联合”) - 任务“学习” .
为此,我们将从
Sequential
开始,但将其重命名为base_model
,以明确它在分支多个任务之前充当基本图层集 . 然后我们使用_96469的函数语法来完成我们需要的每个分支,然后将它们组合在一起作为final_model
的多个输出,其中我们可以表达每个输出的整体损失函数的一部分 .以下是我们如何修改上面的示例来执行此操作:
最后,当调用
final_model.fit
时,您将提供标签列表,其中包含两个与每个输出相关联的张量或标签数组 .您可以阅读有关多输出损耗和架构的更多信息at the Keras docs on multi-input and multi-output models .
最后,请注意,这是一个非常简单的模型(并且可能表现不佳 - 它仅用于说明) . 如果您具有特定的POS特定或特定于情感的体系结构,则可以使用我们创建的辐条
pos_spoke
和sentiment_spoke
来使用具有更复杂网络拓扑的其他层 .它们不是直接定义为
Dense
,而是可能是额外的循环层,甚至可能是卷积等,然后是一些最终的Dense
层,其变量名和层名将用于输出和损失中的适当位置 .另外请注意
return_sequences=True
的用法 . 这允许在序列中的每个步骤进行POS和情绪预测,即使您最终可能只关心情绪预测 . 一种可能的选择是修改sentiment_spoke
以仅对rec_output
的最终序列元素进行操作,或者另一个(不太可能)选项是对输入序列中的每个单词重复句子的整体情绪标签 .