-
0 votesanswersviews
igraph无效顶点Id
我正在尝试使用以下代码运行igraph的快速贪婪社区检测算法: G = Graph() L = [] V = [] for row in cr: try: l = [] source = int((row[0]).strip()) target = int((row[1]).strip()) weight = int((r... -
1 votesanswersviews
聚类数据后的分类与DTW
我的任务是预测测试实例所处的状态 . 我的列车集具有M个实例时间序列,每个实例具有不同的持续时间 . 每个实例在列车数据中有5个状态(s1,s2,s3,s4,s5) . 对于每个实例,所有状态都以相同的顺序出现 . 在我的测试数据中,并非所有实例都具有所有5个状态 . 我的目标是预测特定实例所处的状态 . 未给出类标签 . 我已经执行了分层聚类来分割每个列车实例 . 在预测时,我使用快速DTW来查... -
1 votesanswersviews
如何在R中使用“ComplexHeatmap”包在行注释中添加ID变量?
我创建了一个基本的热图,其中列对应于时间点,每行代表一个人 . 在我的数据集中,我有一个ID变量,我希望它显示在行注释中,以便我可以清楚地看到热图中哪些行与哪个行相对应 . 看看下面的图片 . 我只想在树形图和热图之间的左边显示个别ID . 到目前为止,我已经使用我的CSV文件创建了一个矩阵 mymatrix<-as.matrix(mydata[ ,c(2:9)] 并运行热图功能,同时强制... -
2 votesanswersviews
Python中的层次聚类凸壳
我正在使用层次聚类来尝试可视化已被展平为二维的大量数据 . 我想要做的是创建一个可视化,允许我通过将簇作为其组成点的凸包来查看层次结构中不同高度的数据 . 这个问题中最棘手的部分是我需要一种能够在向上移动层次结构时有效地合并对簇的凸包的算法 . 我已经看到很多用于计算O(n log n)时间点的凸包的算法,但在这种情况下似乎更有效地利用问题的子结构,但我是不确定如何 . Edit: 有关更多信息,... -
1 votesanswersviews
基于r中的簇的总和或组特定列
所以我有一个物种和丰度的数据集,这里有一个样本: aca.qua aca.bah aca.chi achi.lin alb.vul alu.mon ani.vir arc.rho asp.lun aux.roc bag.bag bag.mar bal.cap cal.cal cal.pen 1 0 0 0 0 5 0 ... -
0 votesanswersviews
rect.hclust“border”参数的整数向量
显然,可以使用整数向量作为rect.hclustL的border参数 x <- rect.hclust(foo, k=ncuts, which = c(2,7), border = 3:4) 所以想象一下我有ncuts并且希望每个边框切割都有“伪” - 唯一的颜色: x <- rect.hclust(foo, k=ncuts, which = c(2,7), border = 1:n... -
1 votesanswersviews
输出scipy树形图到TreeView文件
我使用pylab和scipy编写了一个python脚本,根据这篇文章从表达式矩阵输出层次结构的热图和树形图:plotting results of hierarchical clustering ontop of a matrix of data in python 现在我想将我的数组和基因(列和行)树形图导出到文本文件中,以便程序TreeView也可以查看这些数据(例如,cdt,gtr,atr文... -
1 votesanswersviews
python中热图的分层聚类
我有一个NxM matri,其值介于0到20之间 . 我可以使用Matplotlib和pcolor轻松获得热图 . 现在我想使用scipy应用层次聚类和树形图 . 我想重新排序每个维度(行和列)以显示哪个元素相似(根据聚类结果) . 如果矩阵是方形(NxN),则代码类似于: clustering = linkage(matrix, method="average") dendr... -
1 votesanswersviews
给定一个单词列表,如何开发一种语法分组的算法方法?
我正在使用Google Places API,它们包含97个不同位置的list . 我想将位置列表减少到较少数量的位置,因为其中许多位置是可分组的 . 例如, atm 和 bank 成 financial ; temple , church , mosque , synagogue 成 worship ; school , university 成 education ; subway_st... -
0 votesanswersviews
如何在python中自动使用层次聚类分析获得最佳簇数?
我想使用 hierarchical cluster analysis 自动获得最佳数量(K)的簇,然后将此K应用于python中的 K-means clustering . 在研究了很多文章后,我知道一些方法告诉我们可以绘制图形来确定K,但是有任何方法可以在python中自动输出实数吗? -
8 votesanswersviews
通过阈值将SciPy层次树状图切割成簇
我'm trying to use SciPy' s dendrogram 方法根据阈值将我的数据切割成多个簇 . 但是,一旦我创建了树形图并检索其 color_list ,列表中的条目就会少于标签 . 或者,我尝试使用 fcluster 与我在 dendrogram 中确定的相同阈值;但是,这不会产生相同的结果 - 它给了我一个集群而不是三个集群 . 这是我的代码 . import panda... -
4 votesanswersviews
聚类中的大距离矩阵
我在一台16 GB RAM的机器上运行R 3.2.3 . 我有一个3,00,000行×12列的大矩阵 . 我想在R中使用层次聚类算法,所以在我这样做之前,我正在尝试创建一个距离矩阵 . 由于数据是混合类型,我使用不同类型的不同矩阵 . 我收到有关内存分配的错误: df <- as.data.frame(matrix(rnorm(36*10^5), nrow = 3*10^5)) d1=as....