好文档 - 专业文书写作范文服务资料分享网站

计量经济学Lecture4

天下 分享 时间: 加入收藏 我要投稿 点赞

旗开得胜 一元线性回归

在对经济现象进行经济计量分析时,我们需要大量使用回归分析技术。因此,我们首先需要了解回归分析的基本思想。这里,我们从一元线性回归模型开始。 1.回归的含义

考虑一个假想的例子。假设有100人参与博彩(总体),设Y表示每周博彩支出,X表示每周的个人可支配收入。问题是,对于不同的收入水平,人们每周花多少钱购买彩票。表1显示了X和Y的数据。

表1 每周博彩支出和每周个人可支配收入

个人可支配收入 消费者 1 2 3 4 5 6 7 8 9 10 均值 150 28 27 25 33 23 15 18 12 13 15 20.9 175 33 31 29 27 24 20 18 15 14 10 22.1 200 35 31 30 28 26 22 20 17 16 19 24.4 225 36 34 31 29 27 26 23 21 18 16 26.1 每周博彩支出 250 38 36 33 30 28 25 23 22 20 18 27.3 275 40 37 32 30 29 27 25 22 18 32 29.2 300 42 39 34 31 30 29 26 24 25 23 30.3 325 43 35 31 30 29 33 32 30 31 25 31.9 350 45 39 33 30 27 30 28 32 32 34 33 375 46 40 34 31 28 32 30 31 33 31 33.6 表1的最后一行给出了每个收入水平下的平均博彩支出,即E(YX)。根据

1

读万卷书 行万里路

旗开得胜 表1中的数据做Y对X的散点图,如图1

5045403530252015105125150175200225250275300325350375400每周个人可支配收入(美元)每周博彩支出(美元)

图1每周博彩支出和每周个人可支配收入

散点图表明Y随着X的增加而增加,即收入越高,彩票支出可能越多。特别地,就每个收入水平下的Y值而言(图中的圆圈点),这种趋势更加明显。把

Y的条件均值连接起来得到的直线称为总体回归线,其中,X称为解释变量或自变量,Y称为被解释变量或应变量。这里,总体回归线给出了每个收入水平下,平均博彩支出水平。更一般地,总体回归线描述了与解释变量(自变量)相联系的被解释变量平均水平的变化轨迹。

图1中的总体回归线近似线性,可以表示为

E(YXi)??0??1Xi (1)

这个表达式说明随着X值的变化,相应的Y关于X的条件均值也会变化,而且是线性变化。这个表示总体回归线的数学表达式称为总体回归函数。这里,总体回归函数是线性的。

2

读万卷书 行万里路

旗开得胜 在(1)式中,?1和?2称为参数或回归系数。?1是截距,表示X为0时,Y的平均水平,即?0?E(YXi?0)。特别地,在很多实际问题中,截距可能并没有任何经济意义。?2是斜率,表示了X每变动一单位,Y的均值的变化率。

(1)式不能解释图1中的任意义个个体Y,为此,我们在(1)式的基础上加上或减去某个值,表示为

Yi??0??1Xi?ui?E(YXi)?ui (2)

其中,ui表示随机误差项,简称误差项。它是一个随机变量,其值无法先验确定,通常用概率分布描述随机变量。(2)式说明随机误差项反映了Y的实际值与条件均值之间的偏差,这个偏差可正可负,且是未知的。误差项的具体性质见教材6.4节。

例1.下表给出了每周家庭的消费支出Y(美元)与每周家庭的收入X(美元)的数据。

X 80 100 120 140 160 180 200 220 55 65 79 80 102 110 120 135 60 70 84 93 107 115 136 137 65 74 90 95 110 120 140 140 Y 70 80 94 103 116 130 144 152 75 85 98 108 118 135 145 157 88 113 125 140 160 115 162 E(YXi) 65 77 89 101 113 125 137 149 3

读万卷书 行万里路

旗开得胜 240 260 137 150 145 152 155 175 165 178 175 180 189 185 191 161 173 (a) 表中的最后一列给出了每个收入水平下的(算术)平均消费支出,即E(YXi)。 (b) 以收入为横轴,消费支出为纵轴,得到下面的散点图。其中实心点表示个别家庭的观测点,空心点表示每个收入水平下的平均消费支出,即E(YXi)。从散点图可以看出,随着收入水平的提高,平均消费支出上升,具体地,X和Y的均值之间存在线性递增的关系。

210190170每周消费支出15013011090705050100150每周收入200250300

(c) 总体回归模型可以表示为Yi??0??1Xi?ui?E(YXi)?ui。 2.样本回归函数

在实际中,我们很少能拥有整个总体数据。通常,我们仅有来自总体的一个样本。问题是如何根据样本提供的信息来估计总体回归函数。通过样本数据的散点,可以清晰地得到很好地“拟合”了样本数据的直线,称之为样本回归线。相

4

读万卷书 行万里路

旗开得胜 应的数学表达式称为样本回归函数,表示为

????X (3) ???Yi01i?是总体条件均值E(YX)的估计量,?是?0的估计量,?是?1的估计量。其中,Y??i01特别地,每个样本回归线都代表了总体回归线,而由于样本是随机选择的,样本回归线会随着样本的变化而变化。

与总体回归模型类似,样本中的每个个体可以表示为

????X+u?+u?i=Y?i (4) Yi =?01ii?i是ui的估计量,称为残差项,简称残差。 其中u回归分析的主要目的是根据样本回归模型(4)估计总体回归模型(2)。 3.综合1

考虑前面的博彩支出一例。假设总体不能观测,只有下面一个样本容量为10的样本。

表2 来自表1的随机样本

Y 18 24 26 23 31 27 34 35 33 45 32 X 150 175 200 225 250 275 300 325 350 375 200 对上述样本数据建立EViews工作文件,先来看一下Y对X的散点图,

5

读万卷书 行万里路

32spw98mo75dq8n1sig30fluh9bohz00uly
领取福利

微信扫码领取福利

微信扫码分享