.
异方差性
1定义: 对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同。则认为出现了异方差性。
2影响:
① OLS参数估计量非有效:
具有:线性性、无偏性 不具有:有效性
(大样本下)
具有:一致性 不具有:渐进有效性
②变量的显著性检验失去意义
关于变量的显著性检验中,构造了t统计量,他是建立在随机干扰项共同的方差σ2不变,而真确地估计了参数方差S?的基础之上的。如果出现了异方差性其估计值会偏大或偏小。t
Bj检验失去意义。
③ 模型的预测失效
预测值的置信区间中也包含有参数的方差的估计量S?。所以当模型出现异方差性是,任然
Bj使用ols估计量,将导致预测区间篇大或小,预测功能失效。
3判断:
假设4:Var(?i|xi)??
由于异方差性是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
随机误差项方差的表示!
一般的处理方法:首先采用OLS估计,得到残差估计值。用它的平方近似随机误差项的方差。
残差估计值ei?Y?Y(OLS)
~~^2近似随机误差项的方差 Var(?i)?E(?i)?ei
图示检验法
帕克检验与戈里瑟检验 由于f(x)的形式未知,所以要进行各种形式的检验。
2精选
.
选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
GQ检验:适合样本容量大,异方差为单调增或单调减的函数形式。
Step1 将样本观测值按照有可能引起异方差的解释变量观测值排序
Step2 除去c=0.25n观测值,讲剩下的观测值分为两组,每个子样样本容量为0.5(n-c) Step3 对每个子样做OLS,计算出两个残差平方和, 自由度为 0.5(n-c)-k-1 Step4 构建F分布
F>F a (v1,v2) 拒绝同方差性假设,表明存在异方差。
White检验:对任何形式的异方差均试用。
~|?f(X)??~2?f(X)??|eeijiiijiiStep1 做OLS回归,得到Step2 辅助回归
~ 2 ) ? eVar ( ? i ) ? E ( ? i2
i
~2~2????X??X??X2??X2??XX??ei011i22i31i42i51i2ii~2辅助回归是检验ei与解释变量可能组合的显著性。如果存在异方差性,则表明ei与某种解释变量的组合存在显著的相关性,往往显示出比较大的可决系数,并且某一参数的t检验值
比较大。
Step3 在同方差性假设下,辅助回归的可决系数R2 ,与样本容量n的乘积,渐进地服从自由度为辅助回归中解释变量个数的?分布,即 nR~?。
222nR2??a(辅助回归中解释变量个数) 拒绝同方差性假设,表明存在异方差。
4解决:
加权最小二乘法WLS(也称为广义最小二乘法GLS):关键是寻找随机干扰项与解释变量间适当的函数形式。
加权最小二乘估计量,是无偏、有效的估计量。 广义最小二乘法估计量具有BLUE特征。
思路:加权最小二乘法就是对原模型进行加权处理,使新模型不存在异方差性,然后采用普通最小二乘法进行回归。
对较大的残差平方和赋予较小的权,对较小的残差平方和赋予较大的权。
2精选
.
w权=
1f(xij) 普通最小二乘法就是权等于1时的加权最小二乘法。
异方差稳健标准误法:适合样本容量足够大的情况。不具有有效性。 仍用普通最小二乘法估计量,对方差进行修正。
用wls时,寻找合适的函数形式比较困难,所以可以应用异方差稳标准误法来消除异方差带来的后果。
思路:存在异方差性的时候,用普通最小二乘回归的估计量是具有无偏性,一致性,但不具有有效性。只影响了参数估计量的方差和标准差的正确估计。
优点:找不到wls的权时候使用异方差稳健标准误法。修正方差后,使得以估计量方差为基础的统计检验不再失效,预测区间更加合理。
一般经验:对于采用截面数据作为样本的计量及经济学问题,由于在不同样本点上解释变量以外的其他因素差异较大,所以往往存在异方差性。
经济变量固有惯性和滞后期
模型设定偏误:(遗漏了重要的解释变量/模型设定有误 虚假序列相关) 随机干扰项中一个重要的系统性影
序列相关性: 经常出现在以时间序列数据为样本的模型中 响因素。
数据的编造:新数据是通过源数据生
成的。
1定义:随机干扰项序列相关 假设4 Cov(?i,?j)?E(?i,?j)?0
一阶序列相关/自相关:形式1E(?i,?i?1)?0
精选
.
形式2 ?i???i?1??i 一阶自相关系数/自协方差系数 ?
2影响
① OLS参数估计量非有效:
具有线性无偏性,不具有有效性。因为在证明中用了 同方差性 和 独立性条件。 (大样本)具有一致性,不具有渐进有效性。 ②变量的显著性检验失去意义
T统计量是建立在参数方差正确估计的基础之上的。只有当随机干扰项具有同方差和相互独立性时才成立。如果存在序列相关性,则估计的参数方差S^出现偏误,t检验失去意义。
Bj③ 模型的预测失效
区间预测和参数估计量的方差有关,在方差估计有偏误的情况下,预测就不准。
3判断
图示法:残差回归检验法:
可以作为?i的估计
进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。有点就是,可以确定序列相关的形式,适用于各种类型的序列相关。
D.W检验法: Step1 假定条件: 解释变量非随机
随机干扰项为一阶自回归形式:?t???t?1??t 回归模型模型中不能还有滞后变量作为解释变量 回归模型中含有截距项
Step2: 原假设:H0: p=0 即?t不存在一阶自回归
D.W.?2(1??)
精选
.
完全1阶正相关 p=1 dw=0 完全1阶负相关 p=-1 dw=4 完全不相关 p=0 dw=2
上限du 下限dL只与 样本容量n 和解释变量k有关 而与解释变量取值无关
缺点:只能检验一阶自相关,存在一片无法判断的dw值区域,不能检验存在滞后的解释变量的模型。
LM拉格朗日乘数检验法: 克服了DW的缺陷,适用于高阶序列相关和存在滞后解释变量的模型。
Yi??0??1X1i??2X2i????kXki??iStep1:如果怀疑随机干扰项存在p阶段序列相关
Step2:拉格朗日乘数检验就可以用来检验如下受约束回归方程
?t??1?t?1??2?t?2???p?t?p??tYt??0??1X1t????kXkt??1?t?1????p?t?p??t约束条件: H0:
Step3:如果约束条件为真,则LM统计量服从在大样本下自由度为p的渐进x2分布
~????X????X??e~????e~??辅助回归: e
n为辅助回归中样本容量,可决系数也来自该辅助回归。
t011tkkt1t?1pt?ptLM?nR~?22(P) 一阶序列相关就是(n-1)二阶序列相关就是(n-2)
22LM?nR??Step4 如果?(P)则拒绝约束条件为真的原假设,表明可能存在
直到p阶的序列相关性。
精选