首页 文章
  • 4 votes
     answers
     views

    高GPU内存使用但低挥发性gpu-util

    Keras和DL新手在这里 . 我想构建一个模型来训练顺序文本数据以进行分类 . 数据看起来像: id,文字,标签 1,tom.hasLunch,0 2,jerry.drinkWater,1 我用python3.5和keras 2(TF作为后端)构建它 . 模型摘要如下: 第一个/输入层是一个word2Vec嵌入,它是从头开始构建的,有4332个字 . 第二层是一个简单的LSTM层,参数包...
  • 1 votes
     answers
     views

    Keras中LSTM的时间序列变分自动编码器

    我正在研究变分自动编码器(VAE)来检测时间序列中的异常 . 到目前为止,我使用了这个啧啧https://blog.keras.io/building-autoencoders-in-keras.html和https://wiseodd.github.io/techblog/2016/12/10/variational-autoencoder/ . 尽管如此,我在实施VAE时遇到了一些麻烦 . 我...
  • 1 votes
     answers
     views

    如何在TensorFlow中自己的数据集上训练CNN或RNN模型?

    我是TensorFlow的新手,我已经完成了所有使用预训练模型进行深度神经网络的教程 . 现在,我需要知道如何在我自己的数据集上训练CNN / RNN模型? 例如,我发现this IPython笔记本非常整洁,但它使用的是预训练模型 . 我想知道如何使用这个模型来训练我自己的数据集(图像)及其相应的标签 . 提前致谢 .
  • 6 votes
     answers
     views

    如何使用Keras / Theano for Regression配置一个非常简单的LSTM

    我正在努力为简单的回归任务配置Keras LSTM . 官方页面上有一些非常基本的解释:Keras RNN documentation 但要完全理解,带有示例数据的示例配置将非常有用 . 我几乎没有找到使用Keras-LSTM进行回归的示例 . 大多数示例都是关于分类(文本或图像) . 我研究了Keras发行版附带的LSTM示例以及我通过Google搜索找到的一个示例:http://danielh...
  • 1 votes
     answers
     views

    在张量流中是否有使用LSTM RNN进行特征提取的参考文献?

    目前我正在尝试使用预训练的LSTM RNN模型进行特征提取 . 我偶然发现了使用深度神经网络进行特征提取的以下参考 . 那是图像 . https://www.kernix.com/blog/image-classification-with-a-pre-trained-deep-neural-network_p11 以类似的方式我想使用LSTM RNN https://github.com/gu...
  • 0 votes
     answers
     views

    使用带Tensorflow的Keras LSTM时输入形状问题

    我一直在使用Keras(版本1.1.1)LSTM与Theano作为后端没有任何问题 . 现在我想切换到Tensorflow(版本0.8.0)并且无法得到一个简单的例子 . 问题可归结为以下从this Keras-Tensorflow interface tutorial复制的代码段 . from keras.layers import LSTM import tensorflow as tf m...
  • 0 votes
     answers
     views

    Keras - 关于Masking Layer,然后是Reshape Layer

    我想在LSTM之前使用掩码,但是Lstm的输出必须重塑为4 dim . 所以我的代码` main_input = Input(shape=(96,1000), name='main_input') pre_input = BatchNormalization()(main_input) aaa= Masking(mask_value=0)(pre_input) recurrent1 = LS...
  • 2 votes
     answers
     views

    使用Keras从LSTM神经网络中提取权重

    我在keras训练了一个递归神经网络(LSTM),但现在我正努力将所有碎片放在一起 . 具体来说,我无法理解如何重构权重矩阵 . 我有一个输入,一个隐藏和一个输出层,如下所示: # create the model model = Sequential() model.add(LSTM(100, dropout=0.5, recurrent_dropout=0.5, input_shape=(ti...
  • 0 votes
     answers
     views

    在训练完全连接的神经网络时冻结LSTM的权重

    我目前正在训练LSTM以识别发言人 . 它输出一个嵌入,用作softmax的输入 . 然后使用softmax来确定音频文件属于哪个扬声器 . 我想将softmax更改为具有两个隐藏层的完全连接的神经网络 . 在训练完全连接的神经网络时,我将如何使用LSTM创建嵌入(但不改变任何权重)? 谢谢!
  • 0 votes
     answers
     views

    使用Tflearn实现LSTM

    我正在尝试使用Tflearn实现LSTM . 我的ANN正在处理到达序列的图像帧的展开像素,我正在尝试使用LSTM层来学习帧之间的关系 . 问题是LSTM层的输入是通过完全连接的层来进行的,该层输出2-D [sample,no_of_nodes] Tensor但是LSTM需要3-D Tensor [sample,time-step,no_of_nodes] . 我尝试使用 tflearn.resh...
  • 1 votes
     answers
     views

    Tensorflow中的LSTM与隐藏层训练

    我正在搞乱LSTM并且有一个概念性的问题 . 我根据以下规则创建了一个虚假数据矩阵: 对于矩阵中的每个1-D列表: 如果前一个元素小于10,则下一个元素是前一个元素加1 . 否则,这个元素是罪(前一个元素) 这样,它是一个非常简单地基于先前信息的序列 . 我设置了一个LSTM来学习重现并运行它一次一个地在列表上训练 . 我有一个LSTM层,后面是一个完全连接的前馈层 . 它非常容易地学...
  • 1 votes
     answers
     views

    如何在tensorflow中的多个rnn层中设置不同的权重变量?

    嗨,我正在写一个“很多(输入)到很多(输出)”的rnn代码来处理字符预测 . 为此,我将隐藏的图层参数设置如下 . 三个隐藏层,每个隐藏层有100,200和300个隐藏单元 . hidden layers= [100,200,300] 我的代码是这样的 . # parameters. hiddenLayers = [100,200,300] timeStep = 20 # sequence le...
  • 2 votes
     answers
     views

    如何提取训练有素的LSTM模型(Keras - TF后端)的每个门的输出

    我正在使用训练有素的LSTM模型 . 我想在预测时提取每个门的输出,并且输入是单个序列 . 在 recurrent.py (来自keras包)中,将通过以下方式给出: i = self.recurrent_activation(x_i + K.dot(h_tm1_i, self.recurrent_kernel_i)) f = self.recurrent_activation(x_f + K....
  • -2 votes
     answers
     views

    LSTM在CRNN架构中对批量标准化进行加权

    我在基于卷积RNN的网络上尝试按照https://arxiv.org/abs/1603.09025对LSTM权重进行批量标准化,并且我的训练速度和性能得到显着改善 . 从CNN提取的特征被馈送到2层双向LSTM中 . 在我的第一个网络中,我使用了很少的特征映射,因此LSTM层的输入是128.但是,当我增加输入大小(例如256)时,我会在一些迭代后开始获取LSTM输出的NaN(它没有批处理工作正常)...
  • 0 votes
     answers
     views

    具有numpy数组input_fn的估计器

    我正在创建一个带有numpy数组的估算器,以便使用 tf.estimator.inputs.numpy_input_fn 提供给模型 . 如下: def input_fun(data): x, y = data x, y = np.reshape(x, (batch_size, -1, 1)), \ np.reshape(y, (batch_size, -1...
  • 15 votes
     answers
     views

    使用预先训练的word2vec和LSTM进行单词生成

    LSTM / RNN可用于文本生成 . This显示了为Keras模型使用预先训练的GloVe字嵌入的方法 . 如何使用Keras LSTM模型预先训练过的Word2Vec字嵌入? This帖子确实有帮助 . 如何在模型提供单词序列作为输入时预测/生成下一个单词? 尝试了示例方法: # Sample code to prepare word2vec word embeddings ...
  • 6 votes
     answers
     views

    基于深度网络的多输入多输出模型辅助输出的意义

    我正在引用keras documentation构建一个网络,它以嵌入和其他一些重要特性的形式接受多个输入 . 但是如果我们已经定义了主要损失,我不明白辅助损失的确切影响 . 这里我们插入辅助损耗,即使模型中的主要损耗会更高,也可以平滑地训练LSTM和嵌入层 . 如文档中所述,我假设它有助于在嵌入/之前定义的任何其他层上顺利训练 . 我的问题是,如何确定辅助损失的权重 . 我们编译模型并为辅...
  • 0 votes
     answers
     views

    Keras上的多对一LSTM,softmax尺寸误差

    我正在尝试使用LSTM训练一个简单的多对一RNN分类器 . 我的时间步长是100个数据点长7个功能,我总共有192382个样本 . 这是我的模型: model = Sequential() model.add(LSTM(50,input_shape = (100,7),name = 'LSTM',return_sequences=False)) model.add(Dropout(0.2)) mo...
  • 1 votes
     answers
     views

    尝试在Keras中创建BLSTM网络时出现TypeError

    我'm a bit new to Keras and deep learning. I'目前正在尝试复制这个paper但是当我编译第二个模型(使用LSTM)时,我收到以下错误: "TypeError: unsupported operand type(s) for +: 'NoneType' and 'int'" 模型的描述是这样的: 输入(长度 T 是设备特定的窗口大小...
  • 2 votes
     answers
     views

    在Keras中构建具有嵌入层的LSTM网络

    我想创建一个由嵌入层组成的Keras模型,然后是两个带有dropout 0.5的LSTM,最后是一个带有softmax激活的密集层 . 第一个LSTM应该将顺序输出传播到第二层,而在第二个层中,我只对处理整个序列后获取LSTM的隐藏状态感兴趣 . 我尝试了以下方法: sentence_indices = Input(input_shape, dtype = 'int32') embedding_...
  • 1 votes
     answers
     views

    深入学习总结体育比赛

    我是自然语言生成(nlg)和深度学习的新手,我很想知道深度学习是否能够产生一个总结运动游戏的“段落”(几句话),比如足球比赛 . 例如,在前几个句子中,我们可以展示游戏的整体结果(例如,得到的分数),然后用少数其他句子解释一些值得注意的事件(例如,目标或伤害) . 句子的结构以及每个句子应该反映以前人为的真实描述 . 我发现许多工作使用基于模板的自然语言生成(即,用适当的单词填充预定义的插槽)用于...
  • 0 votes
     answers
     views

    用于Keras中多变量时间序列的LSTM的可变输入

    使用Keras,我想在一批大小N上训练RNN(带有LSTM单元),每个时间步长具有K个时间步长和大小为L的向量(解码器输出是大小为L的一个向量) . 可悲的是,我在使其适用于不同尺寸的时间步长时遇到麻烦,即对于不同的K. 有两个与此相关的问题: 每当我尝试用numpy创建一个3D张量时,我得到类型:array(list(array()))而不是type:array(array(array())...
  • 3 votes
     answers
     views

    如何为keras lstm输入重塑我的数据?

    我是Keras的新手,我发现很难理解LSTM层的输入数据的形状 .Keras文档说输入数据应该是具有形状的3D张量(nb_samples,timesteps,input_dim) . 我有808个信号 .每个信号有22个通道和2000个数据点 . Data_shape : (808,22,2000) 此外,我每个信号都有808个标签 . Label_shape : (808,2) Label[1...
  • 0 votes
     answers
     views

    关于LSTM对Keras的理解

    我想知道如何在Keras下工作LSTM . 我们来举个例子吧 . 我的句子长度最多为3个字 . 示例:'你好吗'我在len 4的向量中对每个单词进行矢量化 . 所以我将有一个形状(3,4)现在,我想使用lstm来做翻译 . (只是一个例子) model = Sequential() model.add(LSTM(1, input_shape=(3,4), return_sequences=Tru...
  • 0 votes
     answers
     views

    如何在Keras中设置1D-Convolution和LSTM

    我想使用LSTM层之后的1D-Conv层来对16通道400倍步长信号进行分类 . 输入形状由以下部分组成: X = (n_samples, n_timesteps, n_features) ,其中 n_samples=476 , n_timesteps=400 , n_features=16 是信号的采样数,时间步长和特征(或通道) . y = (n_samples, n_timestep...
  • 1 votes
     answers
     views

    Keras顺序模型数据准备:单行观测

    我的数据是一个400k观测矩阵,每个观测值是一行数据,长度为200个元素 . 我的输出数据是400k 1-hot向量,对应11个输出类 . 我想格式化我的数据为keras顺序模型 . (Keras 2.0.4,Python 3) train_values.shape >>> (400000, 200) data_labels.shape >>> (40000...
  • 2 votes
     answers
     views

    Keras LSTM层输出和numpy LSTM实现的输出相似但不相同,具有相同的权重和输入

    我建模了一个双层LSTM Keras模型,然后通过输入相同的权重和输入,将第一个LSTM层的输出与LSTM层的简单python实现进行比较 . 批次的第一个序列的结果相似但不相同,并且从第二个序列得到的结果偏差太大 . 下面是我的keras模型:为了比较Keras模型,我首先创建了一个中间层,其中中间层输出第一层的结果,第一个序列的结果为 print(intermediate_output[0,0...
  • 4 votes
     answers
     views

    Keras LSTM州

    我想在Keras运行LSTM并获得输出和状态 . 在TF中有类似的事情 with tf.variable_scope("RNN"): for time_step in range(num_steps): if time_step > 0: tf.get_variable_scope().reuse_variables() (ce...
  • 3 votes
     answers
     views

    具有嵌入层的Keras LSTM自动编码器

    我正在尝试在Keras中构建一个文本LSTM自动编码器 . 我想使用嵌入层,但我不知道如何实现它 . 代码看起来像这样 . inputs = Input(shape=(timesteps, input_dim)) embedding_layer = Embedding(numfeats + 1, EMBEDDING_DIM, ...
  • 0 votes
     answers
     views

    Keras中的LSTM如何访问输入?

    我对LSTM处理输入的方式有点困惑 . 众所周知,Keras中LSTM模型的输入格式为(batch_size,timesteps,input_dim) . 我的数据是时间序列数据,其中n个时间步长的每个序列被馈入以预测n个时间步长的值 . 然后,他们如何访问输入?他们处理序列中的每个步骤或同时访问所有步骤?当我检查每个LSTM层的参数数量时 . 它们具有4 * d *(n d),其中n是输入的维数...

热门问题