-
3 votesanswersviews
如何在将它们作为神经网络的输入时处理不同大小的句子?
我给一个句子作为树结构神经网络的输入,其中叶节点将是句子中单词的单词向量 . 该树将是一个binarized constituency(参见二进制vs n-ary分支部分)解析树 . 我正在尝试开发句子的语义表示 . The problem is ,由于每个句子都有不同的解析树和不同的长度,每个句子都会有不同的神经网络 . 由于这种不断变化的神经网络结构,我无法训练它 . 但是本文使用选区和基于依... -
1 votesanswersviews
划分地理空间索引查询
我正在考虑使用 geohash-like 索引存储地理空间信息,也许使用希尔伯特曲线。我的问题是关于如何最好地在这样的索引上拆分区域查询。 例如,这个文章展示了人们可能希望如何将区域查询拆分为多个查询,以避免查询显示位置不佳的范围(请参阅这个图像)。如果你想使用像普通 geohash 这样的 Z 曲线用单个查询搜索圆形区域,你将不得不查询整个左下象限,它只占我们所关注区域的一小部分。 在这种情况下... -
4 votesanswersviews
图像的尺寸减小方法
我正在尝试使用Matlab Toolbox for Dimensionality Reduction来减少一组图像的尺寸 . 问题是:我对减小尺寸知之甚少 . 所以我通过反复试验每一个,将数据集传递给函数 . 到目前为止,我已经尝试了6,PCA返回了一个复数的矩阵 . 其他人被冻结了matlab . 什么图像缩小方法适合图像? -
0 votesanswersviews
组特征子集选择
我正在尝试为分类问题执行特征子集选择,以确定每个 group 的相对优先级 . SKLearn没有意识到这一点 . 如果内置过程执行基于组的子集选择,我很乐意听到它 . 以下是我的数据和代码的表示,用于开始顺序向后逐步过程: feature_set = np.array([[ 1., 1., 88., 42.5, 9., 88., 42.5, 13. ], ... -
1 votesanswersviews
卷积自动编码器和降维
我对卷积自动编码器(CAE)中降维前的卷积步骤的重要性提出了疑问 . 在我看到的许多实现中,CAE使用"flatten"层将最后一个卷积层(具有维度:H,W,C)转换为经典的一维层(dim:H x W x C),然后将一些完全连接的层转换为生成自动编码器的"code" . 但是,我注意到大多数时候,生成的扁平层实际上比输入层的尺寸更大!因此,我有直觉认为那些... -
1 votesanswersviews
是否可以在大型稀疏矩阵上使用scikit TSNE?
scikit documentation解释 fit_transform 只能用于密集矩阵,但我有一个csr格式的稀疏矩阵,我想执行tsne . 文档说使用 fit 方法用于稀疏矩阵,但这不会返回低维嵌入 . 我很欣赏我可以使用 .todense() 中的 .todense() 方法,但我的数据集非常大(0.4 * 10 ^ 6行和0.5 * 10 ^ 4列),所以不适合内存 . 真的,使用稀疏矩... -
3 votesanswersviews
PCA尺寸缩减用于分类
我正在对从CNN的不同层提取的特征使用主成分分析 . 我从here下载了降维工具箱 . 我总共有11232个训练图像,每个图像的特征是6532.所以特征矩阵就像 11232x6532 如果我想要90%的顶级特征我可以很容易地做到这一点,使用SVM减少数据的训练精度是81.73%这是公平的 . 但是,当我尝试具有2408个图像的测试数据时,每个图像的特征是6532.因此用于测试数据的特征矩阵是 24... -
3 votesanswersviews
PCA尺寸缩减用于分类
我正在对从CNN的不同层提取的特征使用主成分分析 . 我已经从here下载了降维工具箱 . 我总共有11232个训练图像,每个图像的特征是6532.所以特征矩阵就像 11232x6532 如果我想要90%的顶级特征我可以很容易地做到这一点,使用SVM减少数据的训练精度是81.73%这是公平的 . 但是,当我尝试具有2408个图像的测试数据时,每个图像的特征是6532.因此用于测试数据的特征矩阵是 ... -
1 votesanswersviews
主成分分析(PCA)假设
我使用PCA减少了3个主要组件中的180维特征空间 . 然后我根据PCA的3个主要组件使用k均值聚类来聚类数据 . 我在维基百科中读到,如果数据集是联合正态分布的,则保证主成分是独立的 . 我没有计算我所有功能的共同分布(180)......这是一个问题吗? 哪些假设(如果有的话)或使用PCA降低维数的最佳实践? -
1 votesanswersviews
使用PCA - MATLAB降低尺寸
我正在尝试使用PCA降低训练集的维度 . 我遇到过两种方法 . [V,U,eigen]=pca(train_x); eigen_sum=0; for lamda=1:length(eigen) eigen_sum=eigen_sum+eigen(lamda,1); if(eigen_sum/sum(eigen)>=0.90) break; ... -
1 votesanswersviews
Matlab:降低维数的PCA
我已经计算了图像数据集的颜色描述符,并生成了152×320矩阵(152个样本和320个特征) . 我想使用PCA来减少图像描述符空间的维度 . 我知道我可以使用Matlab PCA内置函数来实现它,但是我刚刚开始学习这个概念,我想在没有内置函数的情况下实现Matlab代码,这样我就可以清楚地了解函数的工作原理 . 我试图找到如何在网上做到这一点,但我能找到的只是PCA的一般概念或内置函数的实现,而... -
1 votesanswersviews
如何在matlab中的pcares函数中选择ndim参数并降低数据的维数? [重复]
这个问题在这里已有答案: How many principal components to take? 6个答案 how to check whether the image is compressed or not after applying SVD on that image(regarding size of compressed image on disk) 2个答案 Dim... -
1 votesanswersviews
无法使此自动编码器网络正常运行(使用卷积和maxpool图层)
Autoencoder网络似乎比普通的分类器MLP网络更棘手 . 在使用Lasagne进行多次尝试后,我在重建输出中得到的所有内容最接近于MNIST数据库的所有图像的模糊平均值,而不区分输入数字实际上是什么 . 我选择的网络结构是以下级联层: 输入图层(28x28) 2D卷积层,滤波器大小7x7 Max Pooling图层,尺寸3x3,步幅2x2 密集(完全连接)展平层,10个单位... -
2 votesanswersviews
搜索深度自动编码器示例以降低维数
我想配置一个深度自动编码器,以减少输入数据的维数,如paper所述 . 图层大小应该是2000-500-250-125-2-125-250-500-2000并且我希望能够在中间的层 pull out the activation (如文中所述,我想使用值作为坐标) . 输入数据由二进制向量组成,每个向量长度为2000 . 现在我正在寻找 working example ,我可以用它作为起点 . 我... -
0 votesanswersviews
如何使用python和tensorflow从去噪堆叠自动编码器中提取低维特征向量
下面的代码导入MNIST数据集并训练堆叠的去噪自动编码器来破坏,编码,然后解码数据 . 基本上我想用它作为非线性降维技术 . 如何访问模型编码的低维特征,以便将其投入到聚类模型中?理想情况下,我希望较低维度的特征是循环或直线(显然,实际情况并非如此) . import numpy as np import os import sys import tensorflow as tf from t... -
12 votesanswersviews
scikit-learn中文本数据的监督降维
我正在尝试使用scikit-learn对自然语言数据进行一些机器学习 . 我已将我的语料库转换为词袋向量(采用稀疏CSR矩阵的形式),我想知道是否在sklearn中有一个监督维数降低算法能够获取高维,监督数据并进行投影它进入一个较低维度的空间,保留了这些类之间的差异 . 高级问题描述是我有一个文档集合,每个文档都可以有多个标签,我想根据文档内容预测哪些标签会被打到新文档上 . 在它的核心,这是一个... -
0 votesanswersviews
具有稀疏矩阵的sklearn tsne
我试图在具有预先计算的距离值的非常稀疏的矩阵上显示tsne,但是我遇到了麻烦 . 归结为: row = np.array([0, 2, 2, 0, 1, 2]) col = np.array([0, 0, 1, 2, 2, 2]) distances = np.array([.1, .2, .3, .4, .5, .6]) X = csc_matrix((distances, (row, col)...