第11章 面板数据模型 441
数据模型的一般形式。则上式也可写成:
yit=ai+xitbi+uit,i=1,LN,t=1,LT (11.1.2)
进一步,若记第i截面样本数据为:
?x1i1x2i1?yi1?
???yx?x??
yi=?i2?, xi=?1i22i2
LLM
???
?x?y?
?1iTx2iT?iT?
并记:
Lxki1??xi1??ui1?
?????
Lxki2??xi2??ui2?
=,u=, i?????LLMM
?????
??u??LxkiT??iT???xiT?
?b1??a1??y1??x1??u1?
??????????
byxu?2??a2??2??2??2?
y=??,x=??,U=??,b=??,a=??
MMMMM
??????????
?y??x??u??b??a??N??N??N??k??N?
则面板数据模型的一般形式也可写为:
y=a+xb+U (11.1.3)
对于平衡的面板数据,即在每一个截面单元上具有相同个数的观测值,模型样本观测数据的总数等于NT。
当N=1且T很大时,就是所熟悉的时间序列数据;当T=1而N很大时,就只有截面数据。
面板数据模型划分为3种类型:
(1)无个体影响的不变系数模型:ai=aj=a,bi=bj=b
yit=a+xitb+uit,i=1,LN,t=1,LT (11.1.4)
这种情形意味着模型在横截面上无个体影响、无结构变化,可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本假设条件,就可以采用OLS法进行估计(共有k+1个参数需要估计),该模型也被称为联合回归模型(pooled regression model)。 (2)变截距模型:ai≠aj,bi=bj=b
yit=ai+xitb+uit,i=1,LN,t=1,LT (11.1.5)
这种情形意味着模型在横截面上存在个体影响,不存在结构性的变化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项ai (i=1,2,…,N)的差别来说明,故通常把它称为变截距模型。 (3)变系数模型:ai≠aj,bi≠bj
中级计量经济学 442
yit=ai+xitbi+uit,i=1,LN,t=1,LT (11.1.6)
这种情形意味着模型在横截面上存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项ai (i=1,2,…,N)来说明的同时还允许系数向量bi (i=1,2,…,N)依个体成员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。
11.1.3 面板数据模型的优点
1.利用面板数据模型可以解决样本容量不足的问题 2.有助于正确地分析经济变量之间的关系
3.可以估计某些难以度量的因素对被解释变量的影响
11.2 模型形式设定检验
建立面板数据模型首先要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。主要检验如下两个假设:
H1:b1=b2=L=bN (11.2.1)
H2:a1=a2=L=aN; b1=b2=L=bN (11.2.2)
如果接受假设H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系数模型。
下面介绍假设检验的F统计量的计算方法。
首先计算变截距、变系数模型(11.1.6)的残差平方和S1。 如果记
1yi=
T
1
yit,xi=∑Tt=1
T
∑x
t=1
T
it
(11.2.3)
则模型(11.1.6)参数的最小二乘估计为
?=W?1W bixx,ixy,i
? (11.2.4) ?i=yi?xibai
称为群内估计。其中
第11章 面板数据模型 443
Wxx,i=∑(xit?xi)′(xit?xi),Wxy,i=∑(xit?xi)′(yit?yi)
t=1
t=1
TT
Wyy,i=∑(yit?yi)2 (11.2.5)
t=1
T
′,iWxx,iWxy,i,模型(11.1.6)的残差平方和记为S1,则 第i群残差平方和是RSSi=Wyy,i?Wxy
?1
N
S1=∑RSSi (11.2.6)
i=1
其次计算变截距、不变系数模型(11.1.5)的残差平方和S2。 如果记
NNN
Wxx=∑Wxx,i,Wxy=∑Wxy,i,Wyy=1
i=1
∑Wyy,i
i=i=1
则模型(11.1.5)的最小二乘估计为
b?w=W?1xxWxy,a?i=yi?xib?w
(11.2.7)模型(11.1.5)的残差平方和记为S2,则
S2=Wyy?Wxy′W?1
xxWxy (11.2.8)
最后计算不变截距、不变系数模型(11.1.4)的残差平方和S3。 如果记
NTNT
Txx=∑∑(xit?xi)′(xit?xi),Txy=t=1
∑∑(xit?xi)′(yit?yi)
i=1i=1t=1
NT
Tyy=∑∑(y2it?yi) (11.2.9)
i=1t=1
其中
NT
NT
x=
1
NT
∑∑xit
,y=1
y
it
i=1t=1
NT∑∑i=1t=1
则模型(11.1.4)的最小二乘估计为
b?=T?1xxTxy
,a?=y?xb? (11.2.10)模型(11.1.4)的残差平方和记为S3,则
中级计量经济学 444
?1′TxxS3=Tyy?TxyTxy (11.2.11)
由此可以得到下列结论: (1)S1/σu~χ[N(T?k?1)];
(2)在H2下,S3/σu~χ[NT?(k+1)]和(S3?S1)/σu~χ[(N?1)(k+1)]; (3)(S3?S1)/σu与S1/σu独立。
所以,在假设H2下检验统计量F2服从相应自由度下的F分布,即
2
2
2
2
22
22
F2=
(S3?S1)/[(N?1)(k+1)]
~F[(N?1)(k+1),N(T?k?1)] (11.2.12)
S1/[NT?N(k+1)]
若F2统计量的值小于给定显著性水平下的相应临界值,即F2?Fα,则接受假设H2,认为样本数据符合模型(11.1.4)。反之,若F2?Fα,则继续检验假设H1。
同样得到下列结论:
(1)在H1下,S2/σu~χ[NT?(N+k)]和(S2?S1)/σu~χ[(N?1)k]; (2)(S2?S1)/σu与S1/σu独立。
所以,在假设H1下检验统计量F也服从相应自由度下的F分布,即
2
2
2
2
22
F1=
(S2?S1)/[(N?1)k]
~F[(N?1)k,N(T?k?1)] (11.2.13)
S1/[NT?N(k+1)]
若F1统计量的值小于给定显著性水平下的相应临界值,即F1?Fα,则接受假设H1,认为样本数据符合模型(11.1.5)。反之,若F1?Fα,则认为样本数据符合模型(11.1.6)。
11.3 变截距模型
该模型允许个体成员之间存在个体影响,并用截距项的差别来说明。模型的回归方程形式如下:
yit=ai+xitb+uit,i=1,LN,t=1,LT (11.3.1)
其中:xit=(x1it,x2it,L,xkit)为1×k为解释变量,b=(b1,b2,L,bk)′为k×1系数向量,k表示解释变量的个数,ai为个体影响,uit为随机误差项,假设其均值为零,方差为σu,并假
2
第11章 面板数据模型 445
定uit与xit不相关。根据个体影响的不同形式,变截距模型又分为固定影响变截距模型和随机影响变截距模型两种。
11.3.1 固定影响变截距模型
1.最小二乘虚拟变量模型(LSDV)及其参数估计
令yi和xi是第i个个体的T个观测值向量和矩阵,并令ui是随机干扰项T×1向量,模型(11.3.1) 对应的向量形式如下:
yi=eai+xib+ui (i=1,LN) (11.3.2)
其中
?yi1??x1i1x2i1?b1??1????????
x?y??x?b??1?
yi=?i2?,e=??,b=?2?,xi=?1i22i2
MMMLL
???????
?1??b??y??x??T×1?k??iT??1iTx2iT
式(11.3.2)也可以写成
Lxki1??xi1??ui1?
?????
Lxki2??xi2??ui2?
=,u=, i?????LLMM
?????
???u?LxkiT???xiT??iT?
y=Da+xb+U (11.3.3)
其中
?y1??e
???y?2??0y=??,D=(d1,d2,L,dN)=?
LM
???
?0?y?
??N?0L0??a1??x1??u1?
???????
eL0?ax?2??2??u2?
,a=?,x=?, U=?
LLL?M?M?M?
???????
??????u?0Le?NT×N?aN??xN??N?
其中di为第i个单位的虚拟变量,D为NT×N阶虚拟变量矩阵。所以式(11.3.3)称为最小二乘虚拟变量模型(Least Squares Dummy Variable--LSDV)。利用普通最小二乘法可以得到参数ai和b的最优线性无偏估计(BLUE)为
?=[(x?x)′(x?x)]?1[(x?x)′(y?y)] b∑itiiti∑itiitiCV
t=1
t=1
TT
? (11.3.4) ?i=yi?xibaCV
1
其中:yi=
T
1
y,x=∑iti
Tt=1
T
∑x
t=1
T
it
, xit=(x1it,x2it,L,xkit)
在模型(11.3.3)中,参数ai被写为可观测的虚拟变量的系数的形式。因此,式(11.3.4)