问:工具变量到什么程度才合适?
对短面板数据进行GMM回归的时候,遇到两种情况:
①工具变量通过了弱工具变量检验、识别不足和过度识别检验,再用DM检验的时候还是显著的;
②工具变量通过了弱工具变量检验、识别不足和过度识别检验,但用DM检验的时候不是显著的;
看到连玉君教授的一篇文章,选了两个工具变量,汇报了工具变量通过了识别不足和过度识别检验,DWH检验显著。
由此,认为符合第一种情况表明选取的工具变量合适;但也不太确定,想听听您的看法。 答:
工具变量方法经历了两个阶段的发展。传统的工具变量方法中,在线性模型设定下,工具变量需要满足工具变量外生性和工具变量相关性两个假设,这在本科层次的计量教科书中一般都有涉及。在这种情况下,满足这两个假设的变量才是合格的工具变量。Imbens and Angrist(1994)一文的发表则将工具变量方法推向了新的阶段,在这一发展阶段,允许异质性处理效应存在,工具变量方法识别假设的提出和估计量的推导都是在Donald Rubin提出的潜在结果分析框架下进行的,此时IV估计的是局部平均处理效应,IV估计的有效性要求工具变量满足四个条件:(1)工具变量是随机产生的;(2)满足排他性约束;(3)满足单调性假设;(4)满足工具变量相关性。严格的数学表达请参见Imbens and Angrist(1994)。提问中提到的的“工具变量到什么程度才合适?”,准确的回答应该是满足上述四条假设才合适。
提问中提到的弱工具变量检验用于检验假设(4);识别不足检验只需要满足工具变量的个数多余内生变量的个数,这个通常都是满足的;过度识别检验是在假设不存在异质性处理效应的情况下,检验工具变量是否外生的一种方法,该检验只有在存在过度识别(工具变量个数(用N表示)多于内生变量个数(用K表示))的情况下才可以做,并且要求至少有K个工具变量已经满足外生性条件,这样才能检验剩下的N-K个变量是否外生。因此,总结来看过度识别假设检验需要两个很强的假设:(1)至少有K个有效地工具变量;(2)不存在异质性处理效应,因此使用过度识别检验检验工具变量的外生性并不是一种可靠地方法,其检验结果能够提供的有效性信息并不多。DM检验(此处指的应该是Davidson-MacKinnon检验)则是用于检验OLS估计量是否是一致估计,即解释变量是否存在内生性的检验方法,同更常用的Hausman test类似。有观点认为,只有当DW检验或者Hausman检验拒绝原假设,即显示OLS估计存在内生性的时候,才需要使用IV估计,因为IV估计虽然和OLS估计一样是一致估计量的,但是有效性劣于OLS估计。但是,上述内生性检验依赖于我们已经拥有了有效的工具变量,从而能够得到一致估计量,这是很强的假设,很难实现,因为找到一个符合条件的IV实在太难了,更重要的是,我们无法保证我们所使用的工具变量是有效的,所以我们也无法保证DM检验或者Hausman检验的结论一定是有效的。在这种情况下,我本人更倾向于基于变量之间的理论关系和具体的模型设定来判断OLS估计是否内生,从而决定是否需要采用工具变量方法,而不是依赖于某个检验。
参考文献:Imbens and Angrist, 1994,“Identification and Estimation of Local Average Treatment Effects”, Econometrica, 62(2): 467-475.