第四章 经典单方程计量经济学模型:放宽基本假定的模型
一、内容提要
本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用OLS估计模型所带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线性问题以及随机解释变量这四大类问题。
异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的t检验和F检验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法,如图示法、Park与Gleiser检验法、Goldfeld-Quandt检验法以及White检验法等。而当检测出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计。
序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类似,在序列相关存在的情况下,OLS估计量仍具无偏性与一致性,但通常的假设检验不再可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法、Durbin-Watson检验法以及Lagrange 乘子检验法等。存在序列相关性时,修正的估计方法有广义最小二乘法(GLS)以及广义差分法。
多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t-统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。
当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项
同期相关。第一种类型不会对OLS估计带来任何问题。第二种类型则往往导致模型估计的有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量是克服偏误的有效途径。第三种类型的OLS估计则既是有偏、也是非一致的,需要采用工具变量法来加以克服。
二、典型例题分析
1、下列哪种情况是异方差性造成的结果? (1)OLS估计量是有偏的
(2)通常的t检验不再服从t分布。
(3)OLS估计量不再具有最佳线性无偏性。 解答: 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS估计量出现偏误。
2、已知模型
Yt??0??1X1t??2X2t?ut Var(ut)??t2??2Zt2
式中,Y、X1、X2和Z的数据已知。假设给定权数wt,加权最小二乘法就是求下式中的各β,以使的该式最小
RSS??(wtut)2??(wtYt??0wt??1wtX1t??2wtX2t)2
(1)求RSS对?1、?2和?2的偏微分并写出正规方程。 (2)用Z去除原模型,写出所得新模型的正规方程组。
(3)把wt?1/Zt带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 解答: (1)由RSS?22(wu)?(wY??w??wX??wX)?tt?tt0t1t1t2t2t对各β求偏导得如
下正规方程组:
?(wY??wtt0tt0t??1wtX1t??2wtX2t)wt?0 ??1wtX1t??2wtX2t)wtX1t?0 ??1wtX1t??2wtX2t)wtX1t?0
?(wY??w?(wY??wtt0tt(2)用Z去除原模型,得如下新模型
Yt?XXu?0??11t??22t?t ZtZtZtZtZt对应的正规方程组如下所示:
?(?(?(Yt?0XX1???11t??22t)?0 ZtZtZtZtZtYt?0XXX???11t??22t)1t?0 ZtZtZtZtZtYt?0XXX???11t??22t)2t?0 ZtZtZtZtZt(3)如果用
1代替(1)中的wt,则容易看到与(2)中的正规方程组是一样的。 Zt3、已知模型 Yi??0??1X1i??2X2i?ui
式中,Yi为某公司在第i个地区的销售额;X1i为该地区的总收入;X2i为该公司在该地区投入的广告费用(i=0,1,2……,50)。
(1)由于不同地区人口规模Pi可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项ui是异方差的。假设?i依赖于总体Pi的容量,请逐步描述你如何对此进行检验。需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包括自由度);4)接受或拒绝零假设的标准。 (2)假设?i??Pi。逐步描述如何求得BLUE并给出理论依据。 解答:
(1)如果?i依赖于总体Pi的容量,则随机扰动项的方差?i依赖于Pi。因此,要进
22行的回归的一种形式为?i??0??1Pi??i。于是,要检验的零假设H0:?1?0,备择
22假设H1:?1?0。检验步骤如下:
~; 第一步:使用OLS方法估计模型,并保存残差平方项ei2~对常数项C和P的回归 第二步:做eii22第三步:考察估计的参数?1的t统计量,它在零假设下服从自由度为2的t分布。 第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值,
?1的t统计值大于该临界值,则拒绝同方差的零假设。 如果估计的参数?(2)假设?i??Pi时,模型除以Pi有:
YiXXu1??0??11i??22i?i PiPiPiPiPi222由于Var(ui/Pi)??i/Pi??,所以在该变换模型中可以使用OLS方法,得出BLUE估
计值。方法是对Yi/Pi关于1/Pi、X1i/Pi、X2i/Pi做回归,不包括常数项。 4、以某地区22年的年度数据估计了如下工业就业回归方程
Y??3.89?0.51lnX1?0.25lnX2?0.62lnX3
(-0.56)(2.3) (-1.7) (5.8)
R?0.996 DW?1.147
式中,Y为总就业量;X1为总收入;X2为平均月工资率;X3为地方政府的总支出。 (1)试证明:一阶自相关的DW检验是无定论的。 (2)逐步描述如何使用LM检验 解答:
(1)由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临界值为dU?1.664、dL?1.503。由于DW=1.147位于这两个值之间,所以DW检验是无定论的。
(2)进行LM检验:
2~; 第一步,做Y关于常数项、lnX1、lnX2和lnX3的回归并保存残差et~的回归并计算R; ~关于常数项、lnX1、lnX2和lnX3和e第二步,做et?1t2第三步,计算检验统计值(n-1)R=21?0.996=20.916;
第四步,由于在不存在一阶序列相关的零假设下(n-1)R呈自由度为1的?分布。在5%的显著性水平下,该分布的相应临界值为3.841。由于20.916>3.841,因此拒绝零假设,意
味着原模型随机扰动项存在一阶序列相关。
5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:
222water??326.9?0.305house?0.363pop?0.005pcy?17.87price?1.123rain
(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
R2?0.93
F=38.9
式中,water——用水总量(百万立方米),house——住户总数(千户),pop——总人口(千人),pcy——人均收入(元),price——价格(元/100立方米),rain——降雨量(毫米)。
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?
(2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T检验与F检验结果有相矛盾的现象吗?
(3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。 解答:
(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。
这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。
这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的。
T检验与F检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy都是高度相关的,这将使它们的t-值降低且表现为不显著。price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。
6、一个对某地区大学生就业增长影响的简单模型可描述如下
gEMPt??0??1gMIN1t??2gPOP??3gGDP1t??4gGDPt??t
式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。
(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS估计将会存在什么问题?
(2)令MIN为该国的最低限度工资,它与随机扰动项相关吗?
(3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN能成为gMIN1的工具变量吗? 解答:
(1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型