我创建了很多不同的数据集,但我需要创建一个变量ID,它将在每行的第一个数据集中增加1 . 在下一个数据集中,我需要从最后一个数据步骤的ID变量停止的地方继续ID变量 .
我尝试过使用宏变量并保留语句,但它不起作用 . 我正在使用的数据集将发生变化,因此我不能手动进入并将第二个数据集设置为#40处的另一个数据集 . 这是我到目前为止所做的一个例子:
%let test_id=1;
data work.ex1;
set work.ex1_test;
ID + &test_id.;
retain ID 0;
call symput('test_id', &test_id.+1);
first_name= First;
run;
data work.ex2;
set work.ex2_test;
ID + &test_id.;
retain ID length(&test_id.);
call symput('test_id', &test_id.+1);
run;
5 回答
你很亲密,但并不完全 .
您需要将
ID
初始化为宏变量 . 然后递增它 . 然后将宏变量设置为ID
的新值 .首先我认为使用时会出错:
ID + &test_id;
然后使用以下语句重置ID:retain ID 0;
也许这会起作用 . 在set语句中使用end =选项:
然后在数据步骤的代码底部添加:
然后使用以下命令从下一个数据步骤中停止的位置开始:
目的 . 你做这一切的目的是什么?你创建ID变量的目的是什么?如果ID的唯一目的是通过寻址源表名来确定最终结果的来源,那么SAS具有您可以利用的内置功能 . 以下代码是使用数据步骤选项'INDSNAME ='的示例 . 第一部分只是为了组成一些样本表,第二部分是使用这个选项来识别来自哪里 . 这是相当直接的,所以我没有做内联评论 .
您可以使用数据集来存储最后使用的ID而不是宏变量 . 如果您将其设为永久数据集,那么它将跨会话工作 .
可能它不是最优雅的解决方案,但有一种方法可能是:
1)在每个原始数据集上放置一个标记,即:
等等...
2)然后附加所有数据集togeher并创建id变量:
3)最后,使用标记再次分离数据集,以了解每行中的数据集 .