首页 文章
  • 3 votes
     answers
     views

    PCA尺寸缩减用于分类

    我正在对从CNN的不同层提取的特征使用主成分分析 . 我从here下载了降维工具箱 . 我总共有11232个训练图像,每个图像的特征是6532.所以特征矩阵就像 11232x6532 如果我想要90%的顶级特征我可以很容易地做到这一点,使用SVM减少数据的训练精度是81.73%这是公平的 . 但是,当我尝试具有2408个图像的测试数据时,每个图像的特征是6532.因此用于测试数据的特征矩阵是 24...
  • 3 votes
     answers
     views

    PCA尺寸缩减用于分类

    我正在对从CNN的不同层提取的特征使用主成分分析 . 我已经从here下载了降维工具箱 . 我总共有11232个训练图像,每个图像的特征是6532.所以特征矩阵就像 11232x6532 如果我想要90%的顶级特征我可以很容易地做到这一点,使用SVM减少数据的训练精度是81.73%这是公平的 . 但是,当我尝试具有2408个图像的测试数据时,每个图像的特征是6532.因此用于测试数据的特征矩阵是 ...
  • 1 votes
     answers
     views

    主成分分析(PCA)假设

    我使用PCA减少了3个主要组件中的180维特征空间 . 然后我根据PCA的3个主要组件使用k均值聚类来聚类数据 . 我在维基百科中读到,如果数据集是联合正态分布的,则保证主成分是独立的 . 我没有计算我所有功能的共同分布(180)......这是一个问题吗? 哪些假设(如果有的话)或使用PCA降低维数的最佳实践?
  • 0 votes
     answers
     views

    为什么PCA在matlab中为294 * 40矩阵提供矢量作为输出

    我也是统计数据和matlab的新手 . 我必须在我的项目中进行特征选择,所以我使用了主成分分析(pca) . 我提到tutorial to use pca in matlab 我的代码如下, pcaInput = rand(294,40); disp(size(pcaInput)) % output is 294 40 pcaOutput=pca(pcaInput); disp(...
  • 1 votes
     answers
     views

    在MATLAB中用PCA降低特征的维数

    我对PCA感到困惑 . 我有一个尺寸为90x60x12x350的4D图像 . 这意味着每个体素是大小为350的向量(时间序列) . 现在我将3D图像(90x60x12)分成立方体 . 所以让我们说一个立方体包含n个体素,所以我有n个大小为350的向量 . 我想将这个 n 向量减少到只有一个向量,然后计算所有立方体的所有向量之间的相关性 . 所以对于一个立方体,我可以构造矩阵 M ,我只是将每个体素...
  • 7 votes
     answers
     views

    matlab中的PCA选择前n个组件

    我想从矩阵中选择顶部的 N=10,000 主成分 . 在pca完成之后,MATLAB应该返回 pxp 矩阵,但它不会! >> size(train_data) ans = 400 153600 >> [coefs,scores,variances] = pca(train_data); >> size(coefs) ans = ...
  • 2 votes
     answers
     views

    如何从PCA实际减少特征尺寸? [重复]

    这个问题在这里已有答案: Matlab - PCA analysis and reconstruction of multi dimensional data 2个答案 我正在尝试使用Matlab中的pca执行降维 . 从下面的代码中,我得到系数,得分,潜在和t平方 . 但是,如何从pc分析中减少实际尺寸仍然是模糊的 . 我想要做的是将列数(在本例中为3)减少到1或2.你能告诉我怎么做吗? m...
  • 1 votes
     answers
     views

    使用PCA - MATLAB降低尺寸

    我正在尝试使用PCA降低训练集的维度 . 我遇到过两种方法 . [V,U,eigen]=pca(train_x); eigen_sum=0; for lamda=1:length(eigen) eigen_sum=eigen_sum+eigen(lamda,1); if(eigen_sum/sum(eigen)>=0.90) break; ...
  • 1 votes
     answers
     views

    Matlab:降低维数的PCA

    我已经计算了图像数据集的颜色描述符,并生成了152×320矩阵(152个样本和320个特征) . 我想使用PCA来减少图像描述符空间的维度 . 我知道我可以使用Matlab PCA内置函数来实现它,但是我刚刚开始学习这个概念,我想在没有内置函数的情况下实现Matlab代码,这样我就可以清楚地了解函数的工作原理 . 我试图找到如何在网上做到这一点,但我能找到的只是PCA的一般概念或内置函数的实现,而...
  • 1 votes
     answers
     views

    如何在matlab中的pcares函数中选择ndim参数并降低数据的维数? [重复]

    这个问题在这里已有答案: How many principal components to take? 6个答案 how to check whether the image is compressed or not after applying SVD on that image(regarding size of compressed image on disk) 2个答案 Dim...
  • 1 votes
     answers
     views

    如何使用PCA减少pyspark的尺寸

    if __name__ == "__main__": sc = SparkContext(appName="classification") images = sc.binaryFiles("/home/kdh/lessImage/*.jpg") imagerdd = images.map(lambda (x,y...
  • 0 votes
     answers
     views

    如何根据R中的不同变量在图中使用多个符号?

    我已经创建了一个PCA,用于从放置在四个基板上的四个位置上收集的个体进行测量,重复三次 . 我有性别(男性或女性)和“核型”(三个可能类别的因素)和计算每个人的前两个PC分数 . 我想制作一个情节,其中男性和女性有不同的符号,符号的颜色取决于karotype . 我用下面的代码创建了一个图,它为我提供了一个符号颜色编码的三个核型,并在男性和女性周围放置了95%的置信度 . 如何更改每个性别的符号并...
  • 0 votes
     answers
     views

    将稀疏矩阵转换为稀疏数据帧

    我想进行一次rpca并且之前有一个数据帧df . rpca(df, k = 1000, center = FALSE, scale = TRUE, retx = TRUE, p = 10, + q = 2, rand = TRUE) 我收到错误消息:“无法分配大小为500mb的向量” 所以我创建了一个稀疏矩阵m并重复了rpca(不知道这会比原来的df大)所以我得到了错误信息 错误:无法分配大小为1...
  • 2 votes
     answers
     views

    Scikit-learn(sklearn)PCA在稀疏矩阵上抛出类型错误

    从sklearn RandomizedPCA的documentation中,稀疏矩阵被接受为输入 . 然而,当我用稀疏矩阵调用它时,我得到了一个 TypeError : > sklearn.__version__ '0.16.1' > pca = RandomizedPCA(n_components=2) > pca.fit(my_sparce_mat) TypeError: A...
  • 9 votes
     answers
     views

    使用sklearn在大型稀疏矩阵上执行PCA

    我试图在庞大的稀疏矩阵上应用PCA,在下面的链接中它表示sklearn的randomizedPCA可以处理scipy稀疏格式的稀疏矩阵 . Apply PCA on very large sparse matrix 但是,我总是得到错误 . 有人可以指出我做错了什么 . 输入矩阵'X_train'包含float64中的数字: >>>type(X_train) <class...
  • 0 votes
     answers
     views

    如何在matlab中使用PCA减少矩阵维数? [重复]

    这个问题在这里已有答案: Matlab - PCA analysis and reconstruction of multi dimensional data 2个答案 我想减少更大的尺寸矩阵,即2000 * 768;一些较低的尺寸,即200 * 768或400 * 400(不固定);在MatLab中使用主成分分析(PCA) . 我想用它来减少特征尺寸 . 我怎么能轻易做到?并建议我一些教程,...
  • 0 votes
     answers
     views

    在matlab代码中使用PCA降低尺寸

    我有 [152 X 27578] 152个样本和27578个特征的矩阵,我在matlab中使用PCA函数进行降维 . X = load(dataset); coeff = pca(X); 它生成了一个 [27578 X 151] 的矩阵 . 但是我不明白它究竟产生了什么,我无法理解下一步该做什么 . 任何人都可以帮助我理解吗?我的主要目标是减少原始矩阵的维数
  • 4 votes
     answers
     views

    PySpark PCA:如何将数据帧行从多列转换为单列DenseVector?

    我想使用PySpark(Spark 1.6.2)对Hive表中存在的数值数据执行主成分分析(PCA) . 我能够将Hive表导入Spark数据帧: >>> from pyspark.sql import HiveContext >>> hiveContext = HiveContext(sc) >>> dataframe = hiveConte...
  • 2 votes
     answers
     views

    如何在Matlab中减少PCA

    我是Matlab的新手,使用内置软件包进行PCA减少会遇到一些问题 . 我有37个对象,每个对象由161维向量表示,这意味着我有161 x 37矩阵称为P.我需要将向量维度减少到3.这样每个对象将由3维向量表示 . 我尝试过使用princomp(P),但我不知道要采用哪种输出 . [COEFF,SCORE] = princomp(P); newData = SCORE(:,1:3); 我认为new...
  • 1 votes
     answers
     views

    选定个人的省略号 - Factoextra情节

    为了显示我的PCA(使用FactomineR)的结果的特定功能,我试图用factoextra包来操纵个体和biplot的情节 . 我想在我的个体周围绘制省略号,但它们属于10个不同的组,结果不易读取,所以我想 select the more representative groups for drawing ellipses, while keeping all the individuals r...
  • 1 votes
     answers
     views

    使用PCA进行文本分类的降维

    我正在做文件的文本分类,我有大约4k类和110万个数据样本 . 我正在构建矩阵,其中包含每个文档中的单词频率 . 矩阵样本如下所示 X1 X2 X3 X4 D1 1 1 0 1 D2 1 1 1 0 D3 1 1 0 ...
  • 1 votes
     answers
     views

    在对主成分的不同组合进行回归时,回归系数不会改变

    我运行了一个包含9个变量的PCA,然后想要使用前3个主要组件运行所有可能的线性模型 . 然而,当我运行8个不同的线性模型时,截距和系数估计完全相同,而不管我在模型中使用的因变量 . 我已经更新了R和R Studio,但仍然得到了相同的结果 . 如果有人之前已经处理过这个问题或有任何建议,我真的很感激帮助 . 谢谢! 我用来获取主成分值和线性模型的代码如下 . MOOPCA <- prcomp...
  • 6 votes
     answers
     views

    执行PCA之前和之后的数据维度

    我正在尝试kaggle.com's digit recognizer competition使用Python和scikit-learn . 从培训数据中删除标签后,我将CSV中的每一行添加到如下列表中: for row in csv: train_data.append(np.array(np.int64(row))) 我对测试数据做了同样的事情 . 我使用PCA预处理这些数据以执行降维...
  • 0 votes
     answers
     views

    如何在Python中将2D数组更改为1D数组

    收到错误消息, 预期的2D阵列,改为获得1D阵列:array = [0.00127552 0.00286695 0.00135289 ... 0.00611554 0.02416051 0.00977264] . 如果数据具有单个要素,则使用array.reshape(-1,1)重新整形数据;如果数据包含单个样本,则使用array.reshape(1,-1)重新整形数据 . 试过 tstArr...
  • 0 votes
     answers
     views

    使用PySpark的Spark 2.3.0示例中的PCA

    我有一个Spark数据帧,我想用它来运行一个简单的PCA示例 . 我看了this example并注意到这是有效的,因为它们将功能转换为向量: from pyspark.ml.linalg import Vectors >>> data = [(Vectors.sparse(5, [(1, 1.0), (3, 7.0)]),), ... (Vectors.dense([2...
  • 0 votes
     answers
     views

    在sklearn中计算管道逻辑回归predict_proba

    我有一个包含3个功能和3个类的数据框,我将其拆分为X_train,Y_train,X_test和Y_test,然后使用PCA,StandardScaler和最后的Logistic回归运行Sklearn的Pipeline . 我希望能够直接从LR权重和原始数据计算概率,而不使用predict_proba但不知道如何,因为我不确定管道如何通过PCA和StandardScaler将X_test管道化为逻...
  • 3 votes
     answers
     views

    TensorBoard嵌入可视化工具不显示标签

    我正在尝试使用TensorBoard embedding visualizer来表示我刚刚生成的一组7307动词嵌入,但是当我选择启用3d标签模式时,绘制的点会消失 . 这是我的代码: def plot(tsne_matrix, labels_path): PATH = os.getcwd() LOG_DIR = PATH metadata = os.path.join(LOG_DIR, la...
  • 3 votes
     answers
     views

    为什么PCA在pyspark内存不足?

    当我在pyspark中运行PCA时,我的内存不足 . 这是pyspark 1.6.3,并且执行环境是齐柏林飞艇笔记本 . 这是一个例子 . 设 df 为pyspark DataFrame,其中'vectors'是所需的输入列(包含数据的SparseVector) . from pyspark.ml.feature import PCA pca = PCA(k = 100, inputCol=&qu...
  • 0 votes
     answers
     views

    KNeighbors:ValueError 'continuous-multioutput'

    /home/dogus/anaconda2/lib/python2.7/site-packages/sklearn/utils/validation.py:429:DataConversionWarning:带有输入dtype int8的数据被normalize函数转换为float64 . warnings.warn(msg,_DataConversionWarning)Traceback(最...
  • 0 votes
     answers
     views

    用于降维的PCA MATLAB

    我有一个大小为[4096 x 180]的特征向量,其中180是样本数,4096是每个样本的特征向量长度 . 我想使用PCA减少数据的维度 . 我尝试使用MATLAB [V U]=pca(X) 的内置pca函数,并通过 X_rec= U(:, 1:n)*V(:, 1:n)' 重新构建数据, n 是我选择的维度 . 这将返回4096 x 180的矩阵 . 现在我有3个问题: 如何获得缩小的尺寸?...

热门问题