我使用序列回归树来检查职业轨迹的差异 . 无论是在绘图中还是在树的打印描述中,都有缩写,TraMineR帮助菜单和Matthias Studer关于序列回归树/加权簇的论文都没有解释 .
您能否告诉我以下示例中的以下缩写是什么意思(d-plot对377名参与者的分层进展超过15年(30个周期,每个6个月)?非常感谢!
打印输出
Dissimilarity tree:
Parameters: minSize=18.85, maxdepth=3, R=5000, pval=0.01
Formula: matOM ~ Age + Degree + Gender + YearsSinceGrad
Global R2: 0.011589
Fitted tree:
|-- Root (n: 377 disc: 0.55559)
|-> Age 0.011589
|-- <= 48 with NA (n: 260 disc: 0.53812)[(1,20)-(2,8)-(3,2)] *
|-- > 48 (n: 117 disc: 0.57369)[(1,14)-(2,12)-(3,4)] *
问题1:disc =? ( - >在图中等于s2,见下文)问题2:[(1,20) - (2,8) - (3,2)] * =? (这是最典型的序列吗?)
输出输出问题3:s2 =? (在上面的打印输出中等于"disc")
1 回答
谢谢你的评论!
问题1:是的,情节中的'disc'='s2'(我必须解决这个问题) . 这意味着“差异” . 高差异意味着序列中存在许多变化 . 差异的范围是[0,最大可能距离],因此没有threashold值 . 但是你可以比较一些值 .
Levene测试(在您的情况下似乎不重要,请参见图像)测试差异差异的显着性 . 可以使用
dissassoc
函数运行此测试 . 在树中,Levene测试终端节点中的差异相等(同样,这里差异似乎不重要) .问题2:在打印输出中,方括号[]中的序列是质心 . 这是该子组的最核心序列 .
问题3:见问题1的答案 .
希望这可以帮助 .