首页 文章

序列回归树中的缩写

提问于
浏览
2

我使用序列回归树来检查职业轨迹的差异 . 无论是在绘图中还是在树的打印描述中,都有缩写,TraMineR帮助菜单和Matthias Studer关于序列回归树/加权簇的论文都没有解释 .

您能否告诉我以下示例中的以下缩写是什么意思(d-plot对377名参与者的分层进展超过15年(30个周期,每个6个月)?非常感谢!

打印输出

Dissimilarity tree:
 Parameters: minSize=18.85, maxdepth=3, R=5000, pval=0.01 
 Formula: matOM ~ Age + Degree + Gender + YearsSinceGrad 
 Global R2: 0.011589 

 Fitted tree: 

 |-- Root  (n: 377 disc: 0.55559) 
   |-> Age 0.011589 
             |-- <= 48 with NA    (n: 260 disc: 0.53812)[(1,20)-(2,8)-(3,2)] * 
             |-- > 48    (n: 117 disc: 0.57369)[(1,14)-(2,12)-(3,4)] *

问题1:disc =? ( - >在图中等于s2,见下文)问题2:[(1,20) - (2,8) - (3,2)] * =? (这是最典型的序列吗?)

输出输出问题3:s2 =? (在上面的打印输出中等于"disc")
enter image description here

enter image description here

1 回答

  • 2

    谢谢你的评论!

    问题1:是的,情节中的'disc'='s2'(我必须解决这个问题) . 这意味着“差异” . 高差异意味着序列中存在许多变化 . 差异的范围是[0,最大可能距离],因此没有threashold值 . 但是你可以比较一些值 .

    Levene测试(在您的情况下似乎不重要,请参见图像)测试差异差异的显着性 . 可以使用 dissassoc 函数运行此测试 . 在树中,Levene测试终端节点中的差异相等(同样,这里差异似乎不重要) .

    问题2:在打印输出中,方括号[]中的序列是质心 . 这是该子组的最核心序列 .

    问题3:见问题1的答案 .

    希望这可以帮助 .

相关问题