Java 学习之路

2 votes

answers

views

DecoderRNN的输出包含额外的维度（Pytorch）

我开发了一个编码器（CNN） - 解码器（RNN）网络，用于pytorch中的图像字幕 . 解码器网络接收两个输入 - 来自编码器的上下文特征向量和用于训练的字幕的字嵌入 . 上下文特征向量的大小= embed_size ，它也是 Headers 中每个单词的嵌入大小 . 我在这里的问题更关注Class DecoderRNN的输出 . 请参阅下面的代码 . class DecoderRNN(nn...

python deep-learning pytorch rnn encoder-decoder
0 votes

answers

views

如何在Pytorch中实现每个内存块有多个单元的LSTM层？

我打算在Pytorch中用多个存储单元块实现LSTM - 或多个LSTM单元，LSTM单元是每层的存储块及其门的集合，但似乎基类 torch.nn.LSTM 只能实现多个-layer LSTM，每层有一个LSTM单元： lstm = torch.nn.LSTM(input_size, hidden_size, num_layers) 哪里（来自Pytorch的文件）： input_size...

lstm pytorch
1 votes

answers

views

是否可以在PyTorch中实现具有LSTMCells模块的多层LSTM？

在PyTorch中有一个LSTM模块，除了输入序列，隐藏状态和单元状态之外，还接受 num_layers 参数，该参数指定LSTM具有多少层 . 然而，另一个模块LSTMCell只有输入大小和隐藏状态数作为参数，没有 num_layers ，因为这是多层LSTM中的单个单元 . 我的问题是什么是将LSTMCell模块连接在一起以实现与多层LSTM相同效果的正确方法 num_layers > ...

lstm pytorch multi-layer
1 votes

answers

views

辍学降低了Pytorch中单层LSTM的测试和训练准确度

我在Mnist数据上有一层带有pytorch的层lstm . 我知道对于pytorch中的lstm的一层lstm dropout选项不能运行 . 所以，我在第二层的开头添加了一个丢弃，这是一个完全连接的层 . 但是，我观察到没有辍学我在测试数据上得到97.75％的准确度，而辍学0.5我得到95.36％ . 我想问一下我做错了什么或者出现这种现象的原因是什么？我在测试中将其更改为eval模式，但准确...

lstm pytorch dropout
10 votes

answers

views

如何作为打包序列给出的填充序列由pytorch中的RNN处理？

在pytorch中，我们可以给出一个打包序列作为RNN的输入 . 从official doc开始，RNN的输入可以如下 . input（seq_len，batch，input_size）：包含输入序列特征的张量 . 输入也可以是打包的可变长度序列 . 例 packed = torch.nn.utils.rnn.pack_padded_sequence(embedded, input_lengt...

pytorch
1 votes

answers

views

隐藏单元在PyTorch中的seq2seq模型中饱和

我正试图在 PyTorch 写一个非常简单的机器翻译玩具示例 . 简单来说，我将机器翻译任务变成了这个：给定一个随机序列（[4,8,9 ...]），预测一个序列，其元素的元素加1（[5,9,10，...]） . Id：0,1,2将分别用作pad，bos，eos . 我在机器翻译任务中的玩具任务中发现了同样的问题 . 为了调试，我使用非常小的数据大小 n_data = 50 ，并发现该模型甚...

lstm recurrent-neural-network pytorch
1 votes

answers

views

用于可变长度输入序列的PyTorch RNN梯度非常小

我的目标是对句子进行多类分类 . 我的RNN（LSTM或GRU）的输入是可变长度序列的批量输入（使用Glove嵌入进行索引） . 此输入右侧用零填充 . 我的GRU RNN重新定义的转发是： def last_timestep(self, unpacked, lengths): # Index of the last output for each sequence idx = (...

nlp pytorch rnn
2 votes

answers

views

PyTorch中RNN（nn.LSTM，nn.GRU等）的输出h_n是如何构造的？

文档说 h_n of shape（num_layers * num_directions，batch，hidden_size）：包含t = seq_len隐藏状态的张量现在， batch 和 hidden_size 维度几乎是不言自明的 . 不过，第一个维度仍然是一个谜 . 我假设所有层的所有"last cells"的隐藏状态都包含在此输出中 . 但那么"upp...

python neural-network deep-learning lstm pytorch
0 votes

answers

views

将RNN和LSTM实现为DQN Pytorch代码

我有一些麻烦在伟大的www上找到一些例子我如何用LSTM层实现一个循环神经网络进入我当前的Pytorch深度q网络，所以它变成了DRQN ..跟我一起开始我刚刚开始..更多，我是 NOT 正在处理图像处理，因此CNN也这样做了 not . 我的州是纯粹的温度值 . 这是我的代码，我目前正在训练我的DQN： # Importing the libraries import numpy as np...

python-3.x machine-learning recurrent-neural-network pytorch reinforcement-learning
2 votes

answers

views

如何在PyTorch中使用LSTM进行强化学习？

由于观察不能揭示整个状态，我需要使用循环神经网络进行强化，以便网络对过去发生的事情有某种记忆 . 为简单起见，我们假设我们使用LSTM . 现在内置的PyTorch LSTM需要你输入一个形状为 Time x MiniBatch x Input D 的输入，并输出一个形状张量 Time x MiniBatch x Output D . 然而，在强化学习中，为了知道 t+1 时的输入，我需要知道 ...

recurrent-neural-network backpropagation reinforcement-learning pytorch
0 votes

answers

views

Pytorch中LSTM的可变大小输入

我正在使用可变长度视频的功能来训练一层LSTM . 视频大小从10帧变为35帧 . 我使用的批处理大小为1.我有以下代码： lstm_model = LSTMModel(4096, 4096, 1, 64) for step, (video_features, label) in enumerate(data_loader): bx = Variable(score.view(-1, le...

deep-learning lstm pytorch
1 votes

answers

views

LSTM中输入和标签的PyTorch张量

我是PyTorch的新手，我正在开发一个简单的项目来生成文本，以便了解pytorch . 我正在使用此代码的概念并将其转换为PyTorch：https://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/我有10个时间步长和990个样本 . 对于这990个样本中的每一个，有...

lstm pytorch
21 votes

answers

views

为什么我们在pytorch中“打包”序列？

我试图复制How to use packing for variable-length sequence inputs for rnn但我想我首先需要理解为什么我们需要"pack"序列 . 我理解为什么我们需要"pad"但是为什么"packing"（通过 pack_padded_sequence ）是必要的？任何高级别的解释将不胜感激！...

pytorch
0 votes

answers

views

RNN无法学习积分函数

为了研究深度学习，RNN，LSTM等我试图使RNN适合整合功能 . 我把0到1的随机信号作为RNN的输入，并通过-0.5输入信号偏置成为积分，使0：1之间的积分限制并作为RNN目标学习 . Blue - random input, orange - integrated input 所以我的时间序列只有一个输入（随机）和一个输出（输入的有限积分），我希望RNN通过输入预测输出 . 我使用了Pyt...

time-series lstm integral pytorch rnn
0 votes

answers

views

LSTM序列长度

向大家致以问候！我想询问 general 中是否有 optimal sequence length of a LSTM network ，或 time series prediction 问题？我读到了非常长的RNN网络所遇到的问题，而LSTM试图在一定程度上解决这个问题并取得了成功 . 我还听说过使用LSTM和RNN处理非常大的序列的技术，例如：截断序列，汇总序列，截断反向传播，甚至使用编码...

python deep-learning lstm pytorch rnn
1 votes

answers

views

RNN参数没有更新？

我对PyTorch很新，对神经网络也很新 .我正在尝试构建一个可以猜出性别名称的神经网络，而且我基于判断国籍的PyTorch RNN教程 .我得到的代码运行没有错误，但损失几乎没有变化，让我觉得权重没有更新...这是我输入/输出/目标张量设置的问题吗？或者我的训练功能可能有问题？我很失落，任何帮助都会受到赞赏：cold_sweat：这是我的代码： from __future__ import un...

python machine-learning deep-learning recurrent-neural-network pytorch
0 votes

answers

views

对不同规模的小型车进行培训

我正在尝试在PyTorch中训练一个深度学习模型的图像，这些图像已经被特定维度所取代 . 我想用迷你批次训练我的模型，但是迷你批量大小并没有巧妙地划分每个桶中的例子数量 . 我在a previous post中看到的一个解决方案是用额外的空格填充图像（在训练开始时即时或全部一次），但我不想这样做 . 相反，我希望在培训期间允许批量大小灵活 . 具体来说，如果 N 是存储桶中的图像数量且 B 是批量...

python deep-learning pytorch mini-batch
0 votes

answers

views

如何在邻域中的非常大的图像上计算成对L1距离矩阵？

我正在为我的项目研究深度学习方法 . 我需要计算4D Tensor上的距离矩阵，其大小为 N x 128 x 64 x 64 (Batch Size x Channels x Height x Width) . 这种类型的张量的距离矩阵的大小为 N x 128 x 4096 x 4096 ，并且在GPU中不可能适合这种类型的张量，即使在CPU上它也需要大量的内存 . 因此，我想仅在一些邻域像素（...

c++ numpy tensorflow pytorch
4 votes

answers

views

如何有效地计算Pytorch中的张量？

我有一个张量 x 和 x.shape=(batch_size,10) ，现在我想采取 x[i][0] = x[i][0]*x[i][1]*...*x[i][9] for i in range(batch_size) 这是我的代码： for i in range(batch_size): for k in range(1, 10): x[i][0] = x[i][0] * ...

python machine-learning deep-learning pytorch
0 votes

answers

views

pytorch相当于tf.gather

我在将一些代码从tensorflow移植到pytorch时遇到了一些麻烦 . 所以我有一个尺寸为10x30的矩阵，代表10个例子，每个都有30个特征 . 然后，我有另一个尺寸为10x5的矩阵，其中包含第一个矩阵中每个示例的5个最接近的示例的索引 . 我想使用第二个矩阵中包含的索引“聚集”第一个矩阵中每个示例的5个壁橱示例，让我得到一个形状为10x5x30的3d张量 . 在tensorflow中，这...

tensorflow pytorch
0 votes

answers

views

当我们有model.to（'CUDA'）时为什么我们需要image.to（'CUDA'）

我正在 PyTorch 学习一门课程 . 而且我想知道为什么我们需要分别告诉 torch.utils.data.DataLoader 输出它正在运行的设备 . 如果模型已经在 CUDA 上，为什么它不会相应地自动更改输入？这个模式对我来说很有趣： model.to(device) for ii, (inputs, labels) in enumerate(trainloader): #...

python pytorch
0 votes

answers

views

torch.utils.data.dataloader输出TypeError：'module' object不可调用

因此，我试图学习pytorch，我从教程得到这个代码，它只是导入一个mnist数据集，但它输出“TypeError：'模块'对象不可调用”在教程“dataloader”写成“Dataloader”但当我像它那样运行它输出“AttributeError：module'torch.utils.data'没有属性'Dataloader'” 在文件中下载的数据mnist但我不知道它是否完整 import ...

python-3.x pytorch
0 votes

answers

views

在python IDLE上没有名为torch的模块

我安装了python anaconda，我还通过anaconda提示安装了pytorch . 我在anaconda提示符下键入以下代码 . conda create -n pytorch python=3.7 activate pytorch conda install pytorch-cpu torchvision-cpu -c pytorch 安装完成后，我在anaconda提示符下输入'p...

python pytorch python-idle
0 votes

answers

views

PyTorch - 加载没有子文件夹的图像

首先，我想说我是PyTorch的新手，所以如果我的问题水平不高，我会在建议中道歉 . 我想知道你是否可以帮助我（我实际上有2个问题） . 背后的故事：我正致力于图像分类 . 我的测试数据根据标签分为子文件夹，我通过DataLoader加载它们 . 第一个问题：1）如果您已经训练了具有特定批量大小的模型，那么使用其他尺寸进行测试是否会影响准确性？ 2）有没有办法加载和使用模型与测试数据位于一个文件夹...

python conv-neural-network pytorch
0 votes

answers

views

无法找到就地操作：梯度计算所需的变量之一已通过就地操作进行了修改

我试图计算网络jacobian的损失（即执行双反向），我得到以下错误：RuntimeError：梯度计算所需的变量之一已被inplace操作修改我在代码中找不到inplace操作，所以我不知道要修复哪一行 . *错误发生在最后一行：loss3.backward（） inputs_reg = Variable(data, requires_grad=True) output...

pytorch backpropagation
1 votes

answers

views

Pytorch，有效的方式通过其第一个和最后一个元素扩展张量

我在pytorch中有一个张量 . 我想分别从_88190_位置开始在特定维度上扩展它，分别是该维度的第一个和最后一个元素 .假设我有数据 [[0, 0, 0], [1, 1, 1], [2, 2, 2]] 的张量 . 操作 extend(dim, k) 会以这种方式改变它： extend(0, 1) ：[ [0, 0, 0], [0, 0, 0] ，[0,0,0]，[1,1,1]，[2,2,2]...

python pytorch
2 votes

answers

views

Jupyter Notebook中的Pytorch模块错误

我在激活虚拟环境时使用conda命令安装了pytorch . 但是，当我在Jupyter Notebook中导入火炬模块时会出现一些问题 . 我在提示符和Jupyter Notebook中检查了sys.path . 嗯..在提示符中， sys.path 的结果是 ['', '/home/usrname/anaconda3/lib/python36.zip', '/home/usrname...

python jupyter-notebook torch pytorch
1 votes

answers

views

深度学习：通过不同的库保存和加载通用机器模型

我的问题可以分为两部分 . 是否有可以通过不同库使用的机器学习模型文件格式？例如，我通过pytorch保存了一个模型，然后使用tensorflow加载它？如果没有，是否有一个可以帮助传输格式的库，以便可以直接在keras中使用pytorch机器学习模型？我之所以提出这个问题的原因是，最近我需要将之前训练过的一些模型调整为tensorflow到pytorch . An update ...

python machine-learning tensorflow pytorch
0 votes

answers

views

用于pytorch模型的Coreml模型浮点输入

我有一个pytorch模型，它将 3 x width x height 图像作为输入，像素值在 0-1 之间归一化例如，在pytorch中输入 img = io.imread(img_path) input_img = torch.from_numpy( np.transpose(img, (2,0,1)) ).contiguous().float()/255.0 我将这个模型转换为core...

python ios pytorch coreml onnx-coreml
0 votes

answers

views

顺序学习语言翻译的顺序，看不见的单词

序列到序列学习是一种强大的语言翻译机制，特别是在特定情境的情况下在本地使用它 . 我正在关注this pytorch tutorial的任务 . 但是，该教程没有将数据拆分为培训和测试 . 您可能认为这不是什么大问题，只需将其分开，使用一个块进行培训，另一个进行测试 . 但事情并非那么简单 . 本质上，本教程在引导数据集时创建所看单词的索引 . 索引只是存储在字典中 . 这是在进入编码器RNN之前...

machine-learning tensorflow nlp recurrent-neural-network pytorch

热门问题