首页 文章

在Panel Data模型中创建自变量Stata

提问于
浏览
-1

变量的数据和描述

Picture 1 and Sample unbalanced paneldata

  • 图1显示了我使用在同一图像中作为样本提供的不 balancer 面板数据创建的 balancer 面板数据,其中我有多个产品(ID)不同的年份(YEAR) . 对于每种产品,提供给定产品(ID)的商店数量不同 . 如上所述,这是一个 balancer 的集合,通过整理相同年份,相同的产品(ID)和相同的商店(由样本不 balancer 的paneldata中的橙色区域标记)创建 . 这是一个重要的假设,可能会影响对下述问题的看法 . The following is therefore a description of the table shown in Picture 1:

  • 年表示产品持续给定产品的期限(ID)

  • 商店1,商店2,商店3表示不同公司的特定产品(ID)的不同价格

  • 最小和第二最小值描述了给定年份和产品(ID)的商店,具有该年份的最低和第二低价格 . 这是计算价格差异所需要的,即**(第二最小值 - 最小值)/(最小值)

  • 一个例子,给出了第5行(1995年1月1日 - ID 101),其中价格差异为(3999-3790)/ 3790 = 5,51%(在 Picture 1) 中)

问题

  • 在我的 balancer 面板数据中,( Picture 1) ,我想使用xtreg函数在STATA中运行固定效果回归,其中因变量是价格差异,销售产品的商店数量是自变量 . 这是,所以我可以说当有1个商店销售,有2个商店销售,以及有3个商店销售时,价格差异如何影响因变量 .

  • 另一个问题是,我的假设是否有效创建 balancer 面板?从不 balancer 的paneldata创建 balancer 是否正确,或者我必须使用不 balancer 的面板来创建这样的变量?

  • 所以我的主要问题是如何创建这样的自变量,衡量提供产品的商店数量 . 为了澄清我的意思,我在下面的 Picture 2 中列出了一个示例固定效应回归的示例,该回归可以解释我试图寻找的结构:

NOTE (在 picture 2 中,右边的预期单元格平均值与图1中的价格差异相同,并用作因变量 . 它们作为自变量在公司/商店的数量上回归,这些我有一个问题创建)

Picture 2

我试过了什么

  • 我曾经尝试过,在商店里使用虚拟变量,但最终却被淘汰了 . 图1中提供的数据集是如上所述的 balancer 数据集,需要在paneldata上运行(我假设)固定效果回归 .

结束语

我之前以更加不精确的方式陈述了这个问题,我为此给您带来的不便表示歉意 . 我认为,问题可能是我在excel中设置错误,因此假人被丢弃,或者那种性质的东西 . 它也可能是,我必须使用不 balancer 集来创建这个自变量,这也可能是一个问题,我试图使用 balancer 集而不是不 balancer 集 .

1 回答

  • 1

    在您的不 balancer 样本中(正如我们在评论中讨论的那样, balancer 样本没有意义)我们首先需要为提供每个ID的商店数量创建变量,让我们说我们拥有与顶部相同的数据 . 你的照片1

    egen number_of_firms = rownonmiss(Shop*)
    xtset ID year // to use xtreg, we must tell Stata the data are panel
    xtreg Price_difference i.number_of_firms
    

    xtreg 是图2中显示的回归 .

    如果你希望变量的公司数量格式更像图2,你可以这样做:

    qui levelsof number_of_firms, local(num)
    foreach n in `num' {
        local lab_def `lab_def' `n' "`n' Firms"
    
    }
    label def num_firms `lab_def'
    label values number_of_firms num_firms
    label var number_of_firms "Number of Firms"
    

    然后运行回归,输出将格式化为公司标签的数量 .

相关问题