第二章 一元线性回归模型
1、 最小二乘法对随机误差项u作了哪些假定?说明这些假定条件的意义。 答:假定条件:
(1)均值假设:E(ui)=0,i=1,2,…;
(2)同方差假设:Var(ui)=E[ui-E(ui)]2=E(ui2)=σu2 ,i=1,2,…;
(3)序列不相关假设:Cov(ui,uj)=E[ui-E(ui)][uj-E(uj)]=E(uiuj)=0,i≠j,i,j=1,2,…; (4)Cov(ui,Xi)=E[ui-E(ui)][Xi-E(Xi)]=E(uiXi)=0; (5)ui服从正态散布, ui~N(0,σu2)。
意义:有了这些假定条件,就能够够用一般最小二乘法估量回归模型的参数。 2、 论述对样本回归模型拟合优度的查验及回归系数估量值显著性查验的步骤。
答:样本回归模型拟合优度的查验:可通过总离差平方和的分解、样本可决系数、样本相关系数来查验。
回归系数估量值显著性查验的步骤: (1)提出原假设H0 :β1=0; (2)备择假设H1 :β1≠0; (3)计算 t=β1/Sβ1;
(4)给出显著性水平α,查自由度v=n-2的t散布表,得临界值tα/2(n-2);
(5)作出判定。若是|t|
答:在模型中,自由度指样本中能够自由变更的独立不相关的变量个数。当有约束条件时,自由度减少,其计算公式:自由度=样本个数-受约束条件的个数,即df=n-k。一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条件予以确信,由此减去2,也即其自由度为n-2。
5、 试说明样本可决系数与样本相关系数的关系及区别,和样本相关系数与β^1的关系。 答:样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。但样本相关系数与样本可决系数在概念上有明显的区别,r成立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r2成立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的说明程度。
6、 已知某市的货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)1985~1998年的样本观测值见下表(略)。
Dependent Variable: Y Method: Least Squares Date: 10/28/13 Time: 10:25
Sample: 1985 1998 Included observations: 14
Variable GDP C
R-squared Adjusted R-squared . of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient
Std. Error
t-Statistic
Prob.
Mean dependent var . dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
∧ (1) 一元线性回归方程 Yt=+
(2) 结构分析 β^1=是样本回归方程的斜率,它表示某市货物运输量的情形,说明货物运输量每增加1亿元,将26,95425用于国内生产总值;β^0=是样本回归方程的截距,它表示不受货物运输量阻碍的国内生产总值。
(3)统计查验 r2= 说明总离差平方和的78%被样本回归直线说明,有22%没被说明,说明样本回归直线对样本点的拟合优度仍是比较高的。
显著性水平 α=,查自由度v=14-2=12的t散布表,得临界值(12)= (4)预测区间1980~2000
obs 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
GDP
620
RESID
Y 18249 18525 18400 16693 15543 15929 18308 17522 21640 23783 24040 24133 25090 24505
YF
20057.
YFSE
1806.
单个值预测区间 Y2000∈[均值预测区间 E(Y2000)∈[、查中国统计年鉴,利用1978~2000的财政收入和GDP的统计资料,要求以手工和EViews软件。 (1)散点图
100,00080,00060,000GDP40,00020,0000010,00030,00050,000Y70,00090,000
Prob.
Dependent Variable: Y Method: Least Squares Date: 10/29/13 Time: 16:40 Sample: 1978 2000 Included observations: 23
Variable GDP C
R-squared Adjusted R-squared . of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient
Std. Error
t-Statistic
Mean dependent var . dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
一元线性回归方程 Y=+
经济意义 国名收入每增加1亿元,将有亿元用于国内生产总值。
(2)查验 r2=99%,说明总离查平方和的99%被样本回归直线说明,仅有1%未被说明,因此说样本回归直线对样本点的拟合优度很高。
显著性水平α=,查自由度v=23-2=21的t散布表,得临界值(21)=。 (3)预测值及预测区间
obs 1978 1979 1980 1981
Y
YF
YFSE
GDP