我正在使用Python来训练word2vec模型并为词汇表中的每个单词进行嵌入 . 之前我使用 gensim 来做这个,我也注意到这样的模型可以通过 TensorFlowTheano 等工具进行训练 .

但是,在这些训练过程中,输入只是基本上为 string 格式的文本,然后这些单词将被映射到 index 进行训练 . 就我而言,我想输入 arrays 进行培训 . 在一些设计的操作之后,这些阵列可以是单热编码的矢量或其他矢量 .

那么,是否存在通过输入向量来训练word2vec模型的现有工具?如果没有这样的工具,任何建议让我学习,以便我可以编写自己的代码?