第1章 回归分析实验
目次 1.1 线性回归模型 1.2 非线性回归模型
1.3 线性回归分析实验示范
1.3.1 背景资料 1.3.2 实验步骤分解
1.4 非线性回归分析实验示范
1.4.1 背景资料 1.4.2 回归报告 1.4.3 结果解释 1.5 回归分析实验练习 注记1 参考文献 附表1
1.1 线性回归模型
考虑线性计量经济模型
Yi=a0+b1X1i+…+bmXmi+ui (1-1)
其中:a0为截距,b1,…,bm为回归系数,X1i,,Xmi为解释变量,它们是非随机变量,ui为随机扰动项。当m?1时,模型1-1称为一元线性回归模型或单变量线性模型;当m?1时,模型1-1称为多元线性回归模型。
模型1-1的应用效果取决于模型的系数是否被有效确定,即与其估计系数的t检验和模型的F检验是否显著有关,而这些检验则必须满足一定的前提条件才行。在应用普通最小二乘法(OLS)做回归分析时,如果模型1-1满足以下假设:
假设1-1 解释变量和随机扰动项线性无关:cov(ui,Xji)?0,j?1,2,…,m
假设1-2 随机扰动项的期望为0:E(ui)?0
假设1-3 随机扰动项服从同方差分布:var(ui)??2,i?1,2,… 假设1-4 随机扰动项没有自相关关系:cov(ui,uj)?0,i?j 假设1-5 随机扰动项服从正态分布:ui~N(0,?2)
假设1-6 解释变量之间没有共线性关系,即任一个解释变量均不能被其余解释变量线性表示得到。
那么,模型1-1的OLS估计量就是最优线性无偏估计量,估计系数的t检验和模型的F检验就是有效的。只要其中的任意一个假设没有得到满足,模型系数的OLS估计量就变成无效或不是最优线性无偏估计的了。
OLS是线性回归模型系数估计的常用方法之一,其实,最大似然估计法(ML)也是常用方法之一。在满足六个假设前提下,除了ML方法估计残差项可能会导致渐进有偏估计以及低估值外,OLS和ML在系数的估计上是一致的,即均是无偏估计。
模型1-1的回归检验,要做以下几个指标的估计和检验。 回归方程的拟合优度主要是由多元判定系数R和校正的多元判定系数R来衡量。在一元回归模型中,曾指出判定系数解释了回归方程对样本的拟合能力或拟合的程度。R2表示回归平方和(SSR)与总离差平方和(SST)之比,即:
22R2?校正的判定系数:
SSR SSTSSE2SSEn?1R?1?n?m?1?1?SSTSSTn?m?1 n?1n?1?1?(1?R2)n?m?1SSE=SST-SSR
系数估计量的t检验,有以下t统计量:
a?a?t??sec(a)??b1?b1?t? ?sec(b1)?~t(n?m?1)??bm?bm??t?sec(bm)??模型1-1的F统计量检验。判定系数R2和F有某种特定的关系,即:
SSRR2n?m?1R2 mmF???SSE1?R2m1?R2n?m?1n?m?1模型1-1的结构稳定性检验。Chow检验的目的是判断多元回归方程的结构稳定性问题。依统计学意义,对不同的局部时间序列数据的回归模型是否存在显著的差异?如果这种差异存在,就称关于整体时间序列数据的回归模型不是结构稳定的,否则就称为结构稳定的。假设模型1-1的随机扰动项ui~N(0,?2)且?2
为随机扰动项的总体方差。现在把时间序列数据分成两个部分,其容量分别为n1和n2,假设已经建立起了以下两个回归模型:
Yi?a'?b1'X1i?Yi?a\?b1\X1i?
?bm'Xmi?ui', (1-2) ?bm\Xmi?ui\ (1-3)
并且ui'~N(0,?2)、ui\~N(0,?2)和ui',ui\相互独立。为了检验模型1-2 和模型1-3是否相容,下面我们需要做Chow检验。
Chow检验的基本假设:ui'~N(0,?2)、ui\~N(0,?2)和ui',ui\相互独立。
第一步:求模型1-1的自由度为n1?n2?m?1的残差平方和SSE; 第二步:求模型1-2的自由度为n1?m?1的残差平方和SSE1; 第三步:求模型1-3的自由度为n2?m?1的残差平方和SSE2; 第四步:考虑到ui',ui\相互独立,置(Chow的F统计量)
SSE?SSE1?SSE2m?1 (1-4) F?SSE1?SSE2n1?n2?2m?2则:
F~F(m?1,n1?n2?2m?2)
第五步:给定显著性水平?,如果F?F(?,m?1,n1?n2?2m?2),或
F?F(1??,m?1,n1?n2?2m?2),则说明回归模型存在结构不稳定;否则的话,不能否认回归模型的结构稳定性。
Chow检验只能判明回归方程关于样本的回归分析是否存在结构不稳定的问题。如果Chow检验证实了回归方程关于样本的回归分析存在结构不稳定,那么是什么原因造成的呢?Chow检验不能给出任何具体答案。
对于线性回归模型,结构稳定性问题来自于样本的结构不稳定性。如果存在两个点,至少有一个不是样本的端点,线性回归模型关于由这两个点所界定的样本的回归分析不存在结构稳定性问题,但是,当扩充样本使得新的样本包含其中一个点或全部两个点时,线性回归模型关于新样本的回归分析就存在结构稳定性问题,则称这个点或两个点为Chow节点。Chow节点的存在说明回归模型关于样本的回归分析存在结构不稳定问题。任意把样本分成两部分(注意每部分的样本容量至少应该保证该样本的回归分析能正常进行为准),求F统计量如式(1-4)所示,如果F检验不是显著的,则可断定不存在结构稳定性问题,否则说明结构稳定性问题是存在的。
在作回归分析时,始终假设随机扰动项服从正态分布。实际情况是否如此,需要作进一步的检验。正态性的检验方法有许多,比如残差直方图、半对数图、JB检验等。
1.2 非线性回归模型
线性回归模型的“线性”有其特殊含义。一方面,模型的线性是指模型关于变量是线性的,另一方面,模型的线性是指模型关于每一项的系数或参数,是线性的。这里的非线性回归模型是指被解释变量关于解释变量是非线性的。通常见到的非线性模型有Cobb——Douglas生产函数、Philips双曲模型、Engel消费函数等。
1.3 线性回归分析实验示范
1.3.1 背景资料
我国重工业增加值可能受到钢材进口、钢材产量和钢材出口的影响,其详细数据见附表1-1。假设Z表示我国重工业当月工业增加值(亿元),X表示钢材进口月均价格(美元/吨),Y表示当月钢材产量(万吨),W表示钢材出口(美元/吨)。如果它们之间存在以下计量关系:
Zt?a?bXt?cYt?dWt??t (1-5)
其中:a,b,c,d分别为截距和系数,?为随机扰动项。
问题:给出模型1-5的回归报告、随机扰动项的正态性检验和回归模型结构
稳定性检验。
1.3.2 实验步骤分解
步骤1:回归报告如表1-1所示
表1-1 回归报告列表
变 量 a X 系 数 估 计 -2 751.96 -1.173 99 标 准 误 差 517.035 2 0.410 233 t统 计 量 -5.322 59 -2.861 76 概 率 0* 0.007 9