家庭对某些商品支出有更大的方差;图5-1显示了一元线性回归中随机变量的方差ui随着解释变量 的增加而变化的情况。 异方差性破坏了古典模型的基本假定,如果我们直接应用最小二乘法估计回归模型,将得不到准确、有效的结果。
1.模型中缺少某些解释变量,从而随机扰动项产生系统模式 由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。 例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装、食品等)的需求,设其模型为: (5-1) 其中Qi表示对某一消费品的需求量,Ii为家庭收入,ui为随机扰动项。ui包括除家庭收入外其他因素对Qi的影响。如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得Qi偏离均值的程度。在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平Ii,Qi偏离均值的程度是不同的,Var(ui) 常数,于是就存在异方差性了。 再比如,以某一时间截面上不同地区的数据为样本,研究某行业的产出随投入要素的变化而变化的关系,建立如下模型: (5-2) 其中Yi表示某行业的产出水平。Li表示劳动力对产出的影响。Ki表示资本对产出的影响,ui表示除劳动力和资本外其他因素对产出水平的影响,诸如地理位置、国家政策等。显然,对于不同的行业 ,这些因素对产出 的影响程度是不 同的,引起 偏离零均值的程度也是不同的,这就出现了异方差。 异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。
自相关性
随机误差项的自相关性可以有多种形式,其中最常见的类型是随机误差项之间存在一阶自相关性或一阶自回归形式,即随机误差项只与它的前一期值相关:cov(ut,u t-1) =E(ut,u t-1) =/= 0,或者u t=f(u t-1),则称这种关系为一阶自相关。 一阶自相关性可以表示为 ut= p1 u i-1 + p2 u i-2 + p3 u i-3 + …… p p u t-p + v t 称之为p 阶自回归形式,或模型 存在 p 阶自相关 由于无法观察到误差项 u t,只能通过残差项 e t来判断 u t 的行为。如果 u t或 e t呈出下图(a) -(d) 形式,则表示u t 存在自相关,如果 ut 或et 呈现图中 (e) 形式,
则 表示 u t不存在自相关
自相关性
线性回归模型中的随机误差项的序列相关问题较为普遍,特别是在应用时间序列资料时,随机误差项的序列相关经常发生。 自相关性产生的原因: 线性回归模型中随机误差项存在序列相关的原因很多,但主要是经济变量自身特点、数据特点、变量选择及模型函数形式选择引起的。 1.经济变量惯性的作用引起随机误差项自相关 2.经济行为的滞后性引起随机误差项自相关 3.一些随机因素的干扰或影响引起随机误差项自相关 4.模型设定误差引起随机误差项自相关 5.观测数据处理引起随机误差项序列相关 自相关的后果: 线性相关模型的随机误差项存在自相关的情况下,用OLS(普通最小二乘法)进行参数估计,会造成以下几个方面的影响。 从高斯-马尔可夫定理的证明过
程中可以看出,只有在同方差和非自相关性的条件下,OLS估计才具有最小方差性。当模型存在自相关性时,OLS估计仍然是无偏估计,但不再具有有效性。这与存在异方差性时的情况一样,说明存在其他的参数估计方法,其估计误差小于OLS估计的误差;也就是说,对于存在自相关性的模型,应该改用其他方法估计模型中的参数。 1.自相关不影响OLS估计量的线性和无偏性,但使之失去有效性 2.自相关的系数估计量将有相当大的方差 3.自相关系数的T检验不显著 4.模型的预测功能失效
MATLAB
MATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。
MATLAB是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的
先进水平。
MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连 matlab开发工作界面
接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。编辑本段
基本应用
MATLAB 产品族可以用来进行以下各种工作: ●数值分析 ●数值和符号计算 ●工程与科学绘图 ●控制系统的设计与仿真 ●数字图像处理技术 ●数字信号处理技术 ●通讯系统设计与仿真
MATLAB在通讯系统设计与仿真的应用
●财务与金融工程 MATLAB 的应用范围非常广,包括信号和图像处理、通讯、控制系统设计、测试和测量、财务建模和分析以及计算生物学等众多应用领域。附加的工具箱(单独提供的专用MATLAB 函数集)扩展了MATLAB 环境,以解决这些应用领域内特定类型的问题。
模型的参数估计
模型的参数估计是在建立了理论模型并收集整理了符合模型的样本数据之后,就可以选择适当的方法估计模型,得到模型的参数估计量,本文主要研究线性回归模型,即用回归分析方法建立线性模型。回归分析的主要目的是要通过样本的回归函数尽可能准确的估计总体回归函数。其中使用最广泛的是普通最小二乘法。现以简单的一元线性回归模型为例运用最小二乘法进行模型的参数估计。
1、什么是一元线性回归模型?
一元回归模型,是最简单的计量经济学模型.在模型中,只有一个解释变量,被解释变量与解释变量之间存在线性关系.
2、一元回归模型的一般形式:
yi=β0+β1xi+μi, i=1,2,…n (1)
其中,y是被解释变量,x是解释变量,β0、β1是待定参数,μ是随机误差项,yi,xi是随机抽取的n组样本观测值.
该方程满足如下条件:
E(μi)=0 Var(μi)=б2 Cov(μi,μj)=0 Cov(xi,ui)=0
i=1,2,...,n j=1,2,…,n i?j
3、模型参数估计的任务
(1)一是求得反映变量之间数量关系的参数(即一元线性回归模型yi=β0+β1xi+μi, i=1,2,…n 中的β0,β1)的估计量;
(2)二是求得随机误差项的分布参数.
4、模型参数估计的普通最小二乘法
普通最小二乘法,是应用最多的参数估计方法. (1)什么是最小二乘原理
在已经获得样本观测值yi,xi(i=1,2,…,n)的情况下,假如参数估计量已经求得记为?0,?1,我们可以得到直线方程:
yi??0??1xi i=1,2,…,n (2)
其中,yi是被解释变量的估计值,它由参数估计量和解释变量的观测值计算得来.
被解释变量的观测值与估计值,在总体上越接近越好.判断的标准是: 二者之差平方和
Q??(yi?yi) 最小.
1n^2^^^^^^ 这就是最小二乘原理.
[思考]为什么用平方和,而不直接将二者的差简单相加?
(2) 从最小二乘原理,根据样本观测值,具体求参数估计值.
由于Q??(yi?yi), (又 yi??0??1xi )
1n^2^^^ =?[yi?(?0??1xi)]
1n^^2 我们可以知道,Q是?0,?1二次函数并且是非负数.所以Q的极小值总是存在的.(为什么?)
根据极值存在的必要条件知,
^^???Q^?0 ????0
??Q?^?0???1 (为什么不是充分条件?)
由此,不难推得:
? ??(?^^?0??1xi?yi)?0???(?^??^ 01xi?yi)xi?0
进而得到:
? ?y^^??i?n?0??1?xi???y??^^ 2ixi0?xi??1?xi
于是解得
???^?x2i?yi??xi?yixi0? ??n?x2i?(?xi)2 ?^n??1??yixi??yi?xi?n?x2i?(?xi)2
另外,可以将公式(6)简化变形得
?????^??xiyi ?1?x?2i ?? (7) ?^__??^0?__y??1x
其中,
x?__i?xi?x;y??y__i?y
(4) (5) (6)
最小二乘法在数学模型建立与检验中的运用



