-
1 votesanswersviews
张量流连续文本序列到序列 . 为何批量?
我正在构建一个序列到序列的莎士比亚预测器,并查看它似乎以50个字符为一组进行批处理的示例代码 . 我有点困惑 . 如果文本是连续的并且您正在处理50个字符的块,那么这肯定意味着您只是根据第50个字符后面的下一个预期字符计算损失,并且该模型从未接受过下一个预期字符的训练其他49个字符 . 换句话说,如果你有1000个字符,20个50个字符,那么它只会被教导预测20个不同的字符 . 这些批次不应该在每... -
0 votesanswersviews
RNN解码器和RNN之间的区别
我们只使用RNN解码器(无编码器)进行文本生成,RNN解码器与纯RNN操作有何不同? TensorFlow中的RNN解码器:https://www.tensorflow.org/api_docs/python/tf/contrib/seq2seq/dynamic_rnn_decoder TensorFlow中的纯RNN:https://www.tensorflow.org/api_docs/pyt... -
0 votesanswersviews
tf.scatter_nd_update变量需求与RNN .__ call__方法
我正在开发RNN并使用Tensorflow 1.1 . 我收到以下错误: tensorflow.python.framework.errors_impl.InvalidArgumentError: The node 'model/att_seq2seq/encode/pocmru_rnn_encoder/rnn/while/Variable/Assign' has inputs from diff... -
0 votesanswersviews
创建序列到序列(seq2seq)张量流模型的集合?
我有一个训练有效的30个时期的张量流seq2seq模型,并为每个时期保存了一个检查点 . 我现在要做的是结合这些检查点中最好的X(基于开发集上的结果) . 具体来说,我就如何在新模型中组合权重找到了一个很好的答案 . 任何帮助将不胜感激 . 相关问题(我认为没有充分回答): Building multiple models in the same graph How to load several... -
1 votesanswersviews
我不知道为什么在我的Keras神经网络模型中,预测形状与训练时标签的形状不一致?
我已经 Build 了一个Keras ConvLSTM神经网络,我想根据一系列10个时间步骤预测一帧前进: 模型: from keras.models import Sequential from keras.layers.convolutional import Conv3D from keras.layers.convolutional_recurrent import ConvLSTM2D ... -
1 votesanswersviews
Seq2Seq聊天机器人模型
我正在构建一个带有序列的chat-bot来编码编码器解码器模型,如NMT . 根据给出的数据,我可以理解,在训练时,它们将解码器输出与编码器单元状态一起馈送到解码器输入 . 我无法弄清楚当我实际部署实时聊天机器人时,我应该如何输入解码器,因为那时我必须预测输出 . 请有人帮我解决这个问题吗? -
1 votesanswersviews
使用Tensorflow实验对Seq2Seq模型进行批处理
我正在尝试转换Seq2Seq model我在本地运行使用Estimator和Experiment来使用Tensorflow分布式功能 . 基本功能和目标设置如下: for every input and response (translation or prompt and response): raw input -> tokenized input -> tokenized r... -
0 votesanswersviews
合并序列嵌入与时间序列特征
我在 Keras 的 Keras 实现的某些方面遇到了麻烦 . 这是我的问题的描述: 我正在尝试训练一个用于单词正确性预测的模型 . 我的模型有两种输入: 一个单词序列(句子) 和一系列特征向量(对于每个单词,我计算特征胜利者为6) . e.g. input_1 = ['we', 'have', 'two', 'review'] input_2 = [[1.25, 0.01, 0.00... -
0 votesanswersviews
在给定RNN序列长度的情况下,正确的训练批次是什么?
我的问题来自于tutorial关于RNN,但它可能是一般RNNs实施问题 . 假设我们想要开发一个模型来使用RNN预测下一个角色,我们有以下训练数据: X = [A, B, C, D, E, F, G, H] Y = [B, C, D, E, F, G, H, I] 在训练期间,我们仅使用序列长度n = 4(展开次数)来考虑1个时期并且一次处理1个批次 . 通过引用的tutorial(甚至在Ka... -
1 votesanswersviews
为什么Paddle在将Dens_vector_sequence输入SeqToseq模型时抛出错误?
我正在尝试使用 paddle-paddle (https://github.com/baidu/Paddle)来训练(编码器 - 解码器)序列以进行POS标记的序列模型 . 但是我没有使用单词indices的单热嵌入作为输入,而是使用我用 numpy 创建的虚构单词向量 . 我在 dataprovider.py 的 hook() 函数中添加了单词vectors到 settings 变量: def ...