我的目标是询问是否可以在Tensorflow word-rnn LSTM生成模型中使用预先训练的GloVe向量,如果有的话,是否有任何关于如何实现这一目标的指导?
我从here引用了这个,我理解(我认为)我应该将这些向量放在model.py的 line 35-37
中的嵌入中 . 从代码中,我看到他没有使用任何预先训练的向量,而是使用输入文本中的单词 .
我已经看到了其他答案,如this,但由于我是Tensorflow和Python的新手,我不完全了解如何将其应用到代码中 .
GloVe生成两个文件,即:
-
词汇表文件,包含所有单词出现次数
-
矢量文件 . 例如[
also -0.5432 -0.3210 0.1234...n_dimensions..
]
另外,我是否必须生成GloVe向量并在同一语料库中训练LSTM模型,还是可以将它们分开?例如 . GloVe( 100k words
),text_to_train( 50k words
)
感谢您的帮助!