我正在使用Stata,我有一个大型数据集,如果他们共享两个变量中的一个,我需要将记录组合在一起 .
例如,采取以下三个观察结果:
Observation | matching var1 | matching var2
1 xxx aaa
2 xxx bbb
3 yay bob
如果我按 var1
对记录进行分组,则前两个观察将在同一组中,最后一个观察将在一个单独的组中 . 同样,如果我使用 var2
进行分组,则观察二和三将在同一组中,观察一个将在一个单独的组中 . 但是,如果我根据 var1
或 var2
的匹配对记录进行分组,则所有观察都将在同一组中 .
我想创建一个'group id'变量,它将在所有这些记录中采用相同的值 .
关于我应该怎么做的任何建议?
1 回答
社区贡献的
group_twoway
(在SSC中可用)可以匹配两个变量:使用您的其他示例: