Java 学习之路

0 votes

answers

views

tensorflow word2vec损失函数不会减少

按照官方示例，我使用tf.nce_loss（）作为损失函数在tensorflow中实现了word2vec . 在培训期间，我一直都没有看到损失减少，如果这是正常的话？因为我的数据集真的很大，我 choose 1 as the epoch num . 我应该增加纪元数以减少损失吗？如果没有，我能做什么 make the loss decrease 或者这对于获得 good version wo...

tensorflow word2vec loss-function
1 votes

answers

views

UnicodeDecodeError：'ascii'编解码器无法解码，使用gensim，python3.5

我在Windows和Linux上都使用python 3.5但是得到了同样的错误：UnicodeDecodeError：'ascii'编解码器无法解码位置0中的字节0xc1：序号不在范围内（128）错误日志如下：重载模块：lazylinker_ext Traceback（最近一次调用最后一次）： File "<ipython-input-2-d60a2349532e>&quot...

encoding utf-8 python-3.5 gensim word2vec
2 votes

answers

views

在Keras中使用word2vec和seq2seq模型

我的目的是构建类似Q＆A机器人的东西，可以根据用户的输入句子生成句子 . 我在gensim中使用预先训练过的word2vec来输入模型 .我的话是中文，但我认为word2vec并不重要 . 我首先把每个句子变成了一个3d数组 . 形状是（sample_n，time_step，word_dim） x = [sentence_1, sentence_2, ... , sentence_n] sent...

nlp deep-learning keras word2vec
0 votes

answers

views

使用word2vec使用rnn进行单词预测

我通过将经过预先训练的 word2vec 单词作为输入来训练网络 . 我想知道我是否可以使用 word2vec 目标字来计算错误成本 . 它似乎不起作用，我从未见过这样的例子或论文 . 是否可以使用word2vec作为计算错误成本的目标值？如果是这样，我应该使用什么样的成本函数？如果没有，请以数学方式解释原因 . 我该如何设置输入和目标？现在我正在使用如下的架构： input : word1, w...

nlp recurrent-neural-network word2vec
2 votes

answers

views

Python：使用向量作为输入训练word2vec模型

我正在使用Python来训练word2vec模型并为词汇表中的每个单词进行嵌入 . 之前我使用 gensim 来做这个，我也注意到这样的模型可以通过 TensorFlow ， Theano 等工具进行训练 . 但是，在这些训练过程中，输入只是基本上为 string 格式的文本，然后这些单词将被映射到 index 进行训练 . 就我而言，我想输入 arrays 进行培训 . 在一些设计的操作之后，这...

python word2vec
0 votes

answers

views

Gensim Word2Vec从预训练模型中选择一组较小的单词向量

我在gensim中有一个大型的预训练Word2Vec模型，我希望在我的Keras模型中使用预训练的单词向量作为嵌入层 . 问题是嵌入大小是巨大的，我不需要大多数单词向量（因为我知道哪些单词可以作为输入发生） . 所以我想摆脱它们来减少嵌入层的大小 . 有没有办法只保留所需的wordvectors（包括相应的索引！），基于单词的白名单？

python keras word2vec gensim word-embedding
3 votes

answers

views

使用word2vec作为张量流输入的LSTM的可变句长

我正在使用word2vec作为输入构建LSTM模型 . 我正在使用tensorflow框架 . 我已经完成了单词嵌入部分，但我遇到了LSTM部分 . 这里的问题是我有不同的句子长度，这意味着我必须做填充或使用指定序列长度的dynamic_rnn . 我和他们两个都在挣扎 . 填充 . 填充的混乱部分是我填充时 . 我的模型就像 word_matrix = model.wv.syn0X = tf...

python tensorflow lstm word2vec
2 votes

answers

views

情绪分析 - 张量流上的LSTM和word2vec模型

我现在正在研究一个包括句子情感分析的项目 . 我得到了本教程的帮助：https://github.com/rvinas/sentiment_analysis_tensorflow 在这个模型中，我使用的CSV文件包含标记为正或负的推文句子 . 我有几个问题： 1.如果我使用像'skip-gram'模型这样的word2vec算法，然后将嵌入层送到这个网络，会有区别吗？或者它与初始化的随机矩阵相同，让...

tensorflow lstm sentiment-analysis word2vec tensorboard
1 votes

answers

views

如何使用word2vec训练分类器？

该代码用于生成word2vec并使用它来训练朴素贝叶斯分类器 . 我能够生成word2vec并成功使用相似性函数 . 作为下一步，我想使用word2vec来训练朴素的贝叶斯分类器 . 目前，当我试图在测试和培训中切割数据时，代码给出了错误 . 如何将word2vec模型转换为数组，以便它可以用作训练数据 . ＃导入库numpy作为np import matplotlib.pyplot作为plt i...

python word2vec naivebayes
0 votes

answers

views

用于多个文件输入的张量流word2vec

我正在尝试在一些内部数据集上训练word2vec skip-gram模型 . 我正在关注tensorflow word2vec_basic.py教程 . 数据集有句子，所以我修改了generate_batch函数并在csv文件中存储（批处理，标签） . 由于数据很大，这些文件被分成了部分文件 . 我需要更改代码的tf.session部分以适应这些多个文件 . 由于内存限制，我无法一次加载所有文件 ...

tensorflow nlp word2vec
1 votes

answers

views

如何解释H2o深度学习输出向量？

我想用H2o深度学习模型预测标签，我无法解释我的H2o深度学习输出 . 这是我的H2o深度学习模型的模型参数 . dl_model = deeplearning.H2ODeepLearningEstimator(hidden =[200,200], epochs = 10, ...

python-3.x deep-learning word2vec h2o
0 votes

answers

views

使用sm_35编译时运行CUDA代码，但使用sm_30失败

我拥有的GPU设备是GeForce GT 750M，我发现它是计算能力3.0 . 我下载了这里找到的CUDA代码：（https://github.com/fengChenHPC/word2vec_cbow . 它的makefile有标志-arch = sm_35 . 由于我的设备是计算能力3.0，我将标志更改为-arch = sm_30 . 它编译得很好，但是当我运行代码时，我收到以下错误： wo...

debugging cuda gpgpu word2vec
2 votes

answers

views

如何将3d Tensor传递给tensorflow RNN embedding_rnn_seq2seq

我正在尝试提供每个世界都有word2vec表示的句子 . 我怎么能在tensorflow seq2seq模型中做到这一点？假设变量 enc_inp = [tf.placeholder(tf.int32, shape=(None,10), name="inp%i" % t) for t in range(seq_length)] 其中包含维度[num_of_ob...

python tensorflow word2vec recurrent-neural-network
0 votes

answers

views

如何在tensorflow_word2vec中找到某个单词的相似单词，比如在gensim中使用model.most_similar？

我使用tensorflow来构建word2vec模型，请参考这里：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/word2vec/word2vec_basic.py#L118 我的问题是，如何找到某个单词的前n个相似的单词 . 我知道在gensim中，我可以保存并加载word2v...

tensorflow word2vec
1 votes

answers

views

Word2Vec输入和输出向量

通过关于udacity的word2vec教程，从文章中可以看出，输入字向量和输出有单独的矩阵 . 例如 . ['the','cat','sat','on','mat'] . 这里输入向量$ w_i $， 'the','cat','on','mat' 将预测 'sat' 的输出向量$ w_o $ . 它通过如下所示的采样softmax来实现，其中 |context| 是上下文字的大小（在这种情...

python tensorflow deep-learning word2vec
3 votes

answers

views

Word2Vec输出向量

据我了解，Word2Vec基于训练语料库构建单词词典（或词汇表），并为词典中的每个单词输出K-dim向量 . 我的问题是，那些K-Dim载体的来源究竟是什么？我假设每个向量是输入和隐藏层之间或隐藏和输出层之间的权重矩阵之一中的行或列 . 但是，我还没有找到任何支持这方面的资源，而且我在编程语言方面的识字能力不足以检查源代码并自行解决 . 任何关于这个主题的澄清评论将不胜感激！

word2vec
5 votes

answers

views

Pyspark如何从word2vec单词嵌入中计算Doc2Vec？

我有一个pyspark数据框，其中包含大约300k个唯一行的语料库，每个行都有一个“doc”，每个文档包含几个文本句子 . 在处理之后，我有每行/ doc的200维矢量化表示 . 我的NLP流程：使用正则表达式udf删除标点符号用nltk雪球udf词干 Pyspark Tokenizer Word2Vec（ml.feature.Word2Vec，vectorSize = 200...

apache-spark nlp pyspark word2vec doc2vec
16 votes

answers

views

如何使用word2vec找到最接近向量的单词

我刚开始使用Word2vec，我想知道如何才能找到最接近向量的单词 . 我有这个向量，它是一组向量的平均向量： array([-0.00449447, -0.00310097, 0.02421786, ...], dtype=float32) 是否有直接的方法在我的训练数据中找到与此向量最相似的单词？或者唯一的解决方案是计算此向量与训练数据中每个单词的向量之间的余弦相似度，然后选择最接近的一个...

python text-mining data-analysis word2vec
0 votes

answers

views

word2vec工具包距离脚本

我正在使用“距离”脚本在我构建的word2vec上找到类似的单词 . 它包含大约1.6M的单词，并由此命令训练： ./word2vec -train processed-text-2016.txt -output vec-cbow-neg.txt -debug 2 -threads 5 -size 300 -window 10 -sample 1e-3 -negative 10 -hs 0 -bi...

distance word2vec
1 votes

answers

views

预测中间词word2vec

我有来自官方github存储库的predict_output_word方法 . 它只接受用skip-gram训练的wod2vec模型，并试图通过对所有输入单词索引的向量求和来预测中间单词，并通过输入单词索引的np_sum长度对其进行分类 . 然后考虑输出并使用softmax来获得预测单词的概率，然后将所有这些概率相加以获得最可能的单词 . 是否有更好的方法来解决这个问题以获得更好的词汇，因为这会给...

machine-learning word2vec
11 votes

answers

views

使用word2vec对类别中的单词进行分类

BACKGROUND 我有一些带有一些样本数据的向量，每个向量都有一个类别名称（地点，颜色，名称） . ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ['tokyo','bejing','washington','mumbai'] -> 'Places' ...

python machine-learning nlp word2vec gensim
1 votes

answers

views

在卷积神经网络分类器中加载预训练的word2vec模型

是否可以在分类器中加载预先训练好的word2vec模型文件进行分类任务？

python word2vec
0 votes

answers

views

Spacy：什么算法用于单词向量？

问题很清楚，只想知道使用什么算法：CBOW，Skipgram，SGNS，Glove？谢谢

nlp word2vec spacy
0 votes

answers

views

tensorflow Word2Vec错误

我在下面的github中下载了word2vec的源代码 . https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec.py 我在pycharm上使用tensorflow . 我正在使用Windows 10.我安装了tensorflow，python，numpy，这些都需要在windows上使用te...

python tensorflow deep-learning word2vec
0 votes

answers

views

使用Word2Vec.load（）时取消错误

我试图使用 gensim.Word2Vec.load(fname) 加载二进制文件，但我收到错误：文件“file.py”，第24行，在model = gensim.models.Word2Vec.load（'ammendment_vectors.model.bin'）文件“/home/hp/anaconda3/lib/python3.6/site-packages/gensim /models...

python gensim word2vec
1 votes

answers

views

gensim - Word2vec在线培训 - AttributeError：'Word2Vec'对象没有属性'model_trimmed_post_training

我正在尝试使用预先训练的模型并为其添加额外的词汇 . 我有一个csv文件，里面有一列句子 . import gensim existing_model_fr = gensim.models.Word2Vec.load('./fr/fr.bin') new_sentences = gensim.models.word2vec.LineSentence('./data/french.csv') e...

nlp word2vec gensim
1 votes

answers

views

当输入二维字符串数组时，gensim.sklearn_api.w2vmodel.W2VTransformer的拟合方法会抛出错误

我正在尝试用word2vec和numpy聚类一些文档 . w2v = W2VTransformer() X_train = w2v.fit_transform(X_train) 当我运行fit或fit_transform时，我收到此错误：线程中的异常Thread-8：Traceback（最近一次调用最后一次）：文件“C：\ Users \ lperona \ AppData \ Local \...

python arrays python-3.6 word2vec gensim
0 votes

answers

views

计算Word2Vec模型的准确性时出现FutureWarning错误

我试图计算Word2Vec模型的准确性 . 这是我的代码： import gensim vectors = gensim.models.KeyedVectors.load("cbow_vectors.kv", mmap='r') questions = "questions-words.txt" analogy_scores = vectors.acc...

python numpy nlp gensim word2vec
2 votes

answers

views

在word2vec Gensim中获取bigrams和trigrams

我目前在word2vec模型中使用uni-gram，如下所示 . def review_to_sentences( review, tokenizer, remove_stopwords=False ): #Returns a list of sentences, where each sentence is a list of words # #NLTK tokenize...

python tokenize word2vec gensim n-gram
0 votes

answers

views

Tensorboard嵌入式投影仪不起作用 . （PCA图是空白的 . ）

我正在实现简单的word2vec嵌入 . 我想用张量板嵌入式投影仪可视化嵌入结果 . 我使用gensim.models.word2vec来处理单词嵌入和tensorboard来可视化向量空间 . 已创建所有ckpt和元数据，tsv文件 . 我的桌面使用相同的代码显示完全正确的结果，但我的笔记本电脑没有显示相同的结果 . 在我的笔记本电脑中，只显示PCA矢量轴（x，y，z） . 不是矢量点 . 当我...

tensorflow gensim word2vec tensorboard embedding

热门问题