-
1117 votesanswersviews
在关系数据库中存储分层数据有哪些选项?
Good Overviews 一般来说,您要在快速读取时间(例如,嵌套集)或快速写入时间(邻接列表)之间做出决定 . 通常,您最终会得到最适合您需求的以下选项组合 . 以下提供了一些深入的阅读: One more Nested Intervals vs. Adjacency List comparison:我发现的邻接列表,物化路径,嵌套集和嵌套间隔的最佳比较 . Models for h... -
0 votesanswersviews
使用多个循环计算来自分层数据集的相关系数和p值
我有一个数据集描述了属于不同(1)物种,(2)性别和(3)生殖阶段的个体的几个行为变量 . 我的目标是创建一系列循环,这些循环允许我计算Spearman相关系数和每个行为变量之间的p值(例如下面的“隐藏”)到每个物种每个性别的另一个感兴趣的变量(下面的“嵌套”)阶段 . 我最终想要的是一个如下所示的数据框: Species Sex Stage Spearman_corr_coef ... -
3 votesanswersviews
在groupby之后访问pandas中的分层列
我使用pandas来分组数据集 . 当我使用不同的函数聚合不同的列时,我得到了一个分层的列结构 . G1 = df.groupby('date').agg({'col1': [sum, np.mean], 'col2': 'sum', 'col3': np.mean}) 结果是: col1 col2 col3 sum ... -
10 votesanswersviews
如何在Java中存储树结构?
分层数据结构通常存储在关系数据库中 . 这种存储是灵活但平坦的,因此必须使用每个查询构建树结构 . 我想将论坛帖子存储为树结构,但应该可以有效地查询,例如按日期或作者选择帖子 . 我想要一个可以从Java访问的开源数据库 . 这样做的最佳方法是什么? CouchDB的? Neo4j的? ...? -
4 votesanswersviews
以最佳方式存储分层数据:NoSQL或SQL
我正在处理分层数据,就像在树结构中一样 . 我想知道将它们存储在数据库中的最佳方法是什么 . 我从MySQL的邻接列表开始 . 但随着数据的增加,性能似乎有所下降 . 我有大约20,000行存储在具有父子关系的MySQL表中,并且将来会增加 . 获取数据需要很长时间,因为我必须根据树的深度编写许多自连接 . 所以我一直在寻找存储这类数据的最佳方法 . 在同一个地方,我发现嵌套集比邻接列表更好 . ... -
0 votesanswersviews
在MPTT中,如何在使用MySQL的节点中找到特定级别的祖先?
有关MPTT的说明,请参见https://www.sitepoint.com/hierarchical-data-database-2/ . 我有一个存储与上面链接相同的分层数据的表,除了它有一个名为 level 的附加列来存储MPTT的深度,其中0级用于根节点,而后代节点的数量增加 . 假设我正在使用MySQL,那么在给定节点和我们想要的级别的情况下获取祖先节点的查询是什么? 例如 . 在一个4... -
2 votesanswersviews
根据R中另一个数据帧中的元数据信息组合Dataframe列
我的数据集在概念上与此问题中的数据集类似:Hierarchical indexing in R dataframe但不是这一个:R: Combine columns based on different information in another column of a dataframe 我想根据另一个数据帧中列的元数据信息,通过对它们进行求和来组合(或重新组合)表中的列 . 这是我的数据集的... -
11 votesanswersviews
在SQL中管理层次结构:MPTT /嵌套集与邻接列表与存储路径
有一段时间我一直在努力解决如何最好地处理SQL中的层次结构 . 由于邻接列表的限制和MPTT /嵌套集的复杂性而感到沮丧,我开始考虑简单地存储密钥路径,作为一个简单的 node_key/node_key/... 字符串 . 我决定编译这三种技术的优点和缺点: 创建/删除/移动节点所需的呼叫数: 邻接= 1 MPTT = 3 Path = 1(用包含该路径的所有节点的新节点路径替换旧节点... -
1 votesanswersviews
Postgresql,使用触发器维护分层数据
我有邻接列表表 account ,列 id , code , name 和 parent_id . 为了使排序和显示更容易,我添加了两列: depth 和 path (物化路径) . 我知道,postgresql有物化路径的专用数据类型,但我想使用更通用的方法,而不是特定于postgresql . 我还在设计中应用了几条规则:1) code 最长可达10个字符2)最大深度为9;所以root帐户可... -
6 votesanswersviews
SQL Server 2005数据库设计 - 与层次结构的多对多关系
Note 我完全重写了我原来的帖子,以便更好地解释我想要了解的问题 . 我试图尽可能地概括这个问题 . 另外,我要感谢回应的原始人 . 希望这篇文章能让事情变得更加清晰 . Context 简而言之,我正在努力理解设计小规模数据库以处理(我认为是)多个多对多关系的最佳方法 . 想象一下公司组织结构的以下场景: Textile Division Marketin... -
478 votesanswersviews
将平台解析成树的最有效/优雅的方法是什么?
假设您有一个存储有序树层次结构的平面表: Id Name ParentId Order 1 'Node 1' 0 10 2 'Node 1.1' 1 10 3 'Node 2' 0 20 4 'Node 1.1.1' 2 10 5 ... -
57 votesanswersviews
什么类型的NoSQL数据库最适合存储分层数据?
什么类型的NoSQL数据库最适合存储分层数据? 比方说,我想存储具有树结构的论坛的帖子: original post + re: original post + re: original post + re2: original post + re3: original post + re2: original post -
4 votesanswersviews
R之间/之内的标准偏差
在处理分层/多级/面板数据集时,采用一个包可以返回可用变量的组内和组之间标准偏差可能非常有用 . 这可以通过命令轻松完成 Stata 中的以下数据 xtsum, i(momid) 我做了一个研究,但我找不到任何 R 包可以做到这一点.. edit: 只是为了解决问题,分层数据集的一个例子可能是这样的: son_id mom_id hispanic mom_smoke... -
6 votesanswersviews
RavenDB和分层文档
我使用RavenDB解决这个问题很困难 . 我有这些课程 . 我从中排除了很多属性以保持示例简单 . public class Menu { public string Name { get; set; } public List<NavigationNode> Nodes { get; set; } } public class NavigationNode { ...