我正在使用Python来训练word2vec模型并为词汇表中的每个单词进行嵌入 . 之前我使用 gensim
来做这个,我也注意到这样的模型可以通过 TensorFlow
, Theano
等工具进行训练 .
但是,在这些训练过程中,输入只是基本上为 string
格式的文本,然后这些单词将被映射到 index
进行训练 . 就我而言,我想输入 arrays
进行培训 . 在一些设计的操作之后,这些阵列可以是单热编码的矢量或其他矢量 .
那么,是否存在通过输入向量来训练word2vec模型的现有工具?如果没有这样的工具,任何建议让我学习,以便我可以编写自己的代码?