中级计量经济学 436
第11章 面板数据模型
11.1 面板数据模型概述
11.1.1 面板数据的含义
面板数据(panel data)也称平行数据,或时间序列截面数据(time series and cross section data)或混合数据(pool data),是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观测值,从纵剖面上看是一个时间序列。
面板数据用双下标变量表示。例如
yi t, i = 1, 2, …, N; t = 1, 2, …, T
表示在横截面i时间t上取值。N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,yi . ( i = 1, 2, …, N)是横截面上的N个个体截面数据序列;若固定i不变,y. t (t ,如图11.1.1所示。 = 1, 2, …, T)是纵剖面上的一个时间序列(个体)
图11.1.1 面板数据示意图
例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。
对于面板数据yi t, i = 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观
第11章 面板数据模型 437
测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
例11.1.1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表11.1.1和表11.1.2。数据是7年的,每一年都有15个数据,共105组观测值。
表11.1.1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格) 地区人均消费 CP-AH(安徽) CP-BJ(北京) CP-FJ(福建) CP-HB(河北)
1996 1997 1998 1999 2000 2001 2002 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485
CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535 CP-JL(吉林) CP-JS(江苏) CP-JX(江西) CP-LN(辽宁)
2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063
CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180 CP-SD(山东) CP-SH(上海) CP-SX(山西) CP-TJ(天津) CP-ZJ(浙江)
3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210
资料来源:《中国统计年鉴》1997-2003。
表11.1.2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格) 地区人均收入 IP-AH(安徽) IP-BJ(北京) IP-FJ(福建)
1996 1997 1998 1999 2000 2001 2002 4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538
中级计量经济学 438
IP-HB(河北) 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152
IP-HLJ(黑龙江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565 IP-JL(吉林) IP-JS(江苏) IP-JX(江西) IP-LN(辽宁)
3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088
IP-NMG(内蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922 IP-SD(山东) IP-SH(上海) IP-SX(山西) IP-TJ(天津) IP-ZJ(浙江)
4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00
资料来源:《中国统计年鉴》1997-2003。
人均消费和收入的面板数据从纵剖面观察分别见图11.1.2和图11.1.3。从横截面观察分别见图11.1.4和图11.1.5。用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
110001000090008000700060005000400030002000199619971998199920002001CPSDCPSHCPSXCPTJCPZJ20024000200019968000600012000100001400019971998IPAHIPBJIPFJIPHBIPHLJ199920002001IPSDIPSHIPSXIPTJIPZJ2002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGIPJLIPJSIPJXIPLNIPNMG 图11.1.2 15个省市人均消费序列(纵剖面) 图11.1.3 15个省市人均收入序列
第11章 面板数据模型 439
140001200010000800060004000200024CP1996CP1997CP199868101214140001200010000800060004000200024IP1996IP1997IP199868101214CP1999CP2000CP2001CP2002IP1999IP2000IP2001IP2002
图11.1.4 15个省市人均消费散点图 图11.1.5 15个省市人均收入散点图(7个横截面叠加) (每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)
15个地区7年人均消费对收入的面板数据散点图见图11.1.6和图11.1.7。图11.1.6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图11.1.7中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。
1100010000900080007000600050004000300020000400080001200016000CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJIP(1996-2002) 图11.1.6 用15个时间序列表示的人均消费对收入的面板数据
中级计量经济学 440
12000
CP1996CP1997CP1998CP1999CP2000CP2001CP2002
10000
8000
6000
4000
IP(1996-2002)
4000
6000
8000
10000
12000
14000
2000
2000
图11.1.7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)
图11.1.8给出北京和内蒙古1996-2002年消费对收入散点图。图11.1.9给出15个省级地区1996和2002年的消费对收入散点图。
图11.1.8 北京和内蒙古1996-2002年消费对收入时序图 图11.1.9 1996和2002年地区消费对收入散点图
11.1.2 面板数据模型的基本类型
我们把建立在面板数据基础上的计量经济模型称为面板数据模型。设yit为被解释变量在xjit为第j个解释变量在横截面i和时间t上的数值,uit为横截横截面i和时间t上的数值,
面i和时间t上的随机误差项;bji为第i截面上的第j个解释变量的模型参数;ai为常数项或截距项,代表第i横截面(第i个体的影响);解释变量数为j=l,2,…,k;截面数为i=1,2,…,N;时间长度为t=1,2,…,T。其中,N表示个体截面成员的个数,T表示每个截面成员的观测时期总数,k表示解释变量的个数。则单方程面板数据模型的(分量)一般形式可写成:
yit=ai+b1ix1it+b2ix2it+L+bkixkit+uit (i=1,2,L,N;t=1,2,L,T) (11.1.1)
若记:xit=(x1it,x2it,L,xkit)为1×k为解释变量,bi=(b1i,b2i,L,bki)′为k×1系数向量,
2
的假设。式(11.1.1)为单方程面板uit为随机误差项,满足相互独立、零均值、同方差为σu