第3章 多元线性回归模型
一、单项选择题
1.在由n?30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为( D )
A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2.下列样本模型中,哪一个模型通常是无效的(B) A. B. C. D.
CiQis(消费)=500+0.8
Ii(收入)
Qid(商品需求)=10+0.8
Ii(收入)+0.9(价格)
Pi(价格)
(商品供给)=20+0.75
PiYi(产出量)=0.65
L0.6i(劳动)
Ki0.4(资本)
后,在0.05的显著性水平上对
3.用一组有30个观测值的样本估计模型性作t检验,则A.
yt?b0?b1x1t?b2x2t?utb1的显著
b1显著地不等于零的条件是其统计量t大于等于( C )
t0.05(30) B.
t0.025(28) C.
t0.025(27) D.
F0.025(1,28)
lnyt?lnb0?b1lnxt?utb中,1的实际含义是( B )
A.x关于y的弹性 B. y关于x的弹性 C. x关于y的边际倾向 D. y关于x的边际倾向
4.模型
5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( C )
A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度
6.线性回归模型yt?b0?b1x1t?b2x2t?......?bkxkt?ut 中,检验H0:bt?0(i?0,1,2,...k)时,所用的统
计量 服从( C ) A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2) 7. 调整的判定系数 A.R?2 与多重判定系数 之间有如下关系( D )
n?1n?1R2 B. R2?1?R2
n?k?1n?k?1n?1n?12C. R?1?(1?R2) D. R2?1?(1?R2)
n?k?1n?k?18.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。
A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 D.A、B、C 都不对
9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n≥k+1 B n B 如果模型的R 较低,我们可以认为此模型的质量较差 C 如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D 如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量 0111.半对数模型中,参数?1的含义是( C )。 A.X的绝对量变化,引起Y的绝对量变化 22Y????lnX?? 16 B.Y关于X的边际变化 C.X的相对变化,引起Y的期望值绝对量变化 D.Y关于X的弹性 0112.半对数模型中,参数?1的含义是( A )。 A.X的绝对量发生一定变动时,引起因变量Y的相对变化率 B.Y关于X的弹性 C.X的相对变化,引起Y的期望值绝对量变化 D.Y关于X的边际变化 lnY????X??0113.双对数模型中,参数?1的含义是( D )。 A.X的相对变化,引起Y的期望值绝对量变化 B.Y关于X的边际变化 C.X的绝对量发生一定变动时,引起因变量Y的相对变化率 D.Y关于X的弹性 二、多项选择题 1.将非线性回归模型转换为线性回归模型,常用的数学处理方法有( ? ) A.直接置换法 B.对数变换法 C.级数展开法 D.广义最小二乘法 E.加权最小二乘法 lnY????lnX??2.在模型 lnYi?ln?0??1lnXi??i中( ABCD ) A. Y与X是非线性的 B. Y与?1是非线性的 C. lnY与?1是线性的 D. lnY与lnX是线性的 E. Y与lnX是线性的 013.对模型t( BCD ) y?b?bx1t?b2x2t?ut进行总体显著性检验,如果检验结果总体线性关系显著,则有 A. b1?b2?0 B. b1?0,b2?0b?b?0 C. b1?0,b2?0 22D. 1 E. 1 4. 剩余变差是指( ACDE ) A.随机因素影响所引起的被解释变量的变差 B.解释变量变动所引起的被解释变量的变差 C.被解释变量的变差中,回归方程不能做出解释的部分 D.被解释变量的总变差与回归平方和之差 E.被解释变量的实际值与回归值的离差平方和 5.回归变差(或回归平方和)是指( BCD ) A. 被解释变量的实际值与平均值的离差平方和 B. 被解释变量的回归值与平均值的离差平方和 C. 被解释变量的总变差与剩余变差之差 D. 解释变量变动所引起的被解释变量的变差 E. 随机因素影响所引起的被解释变量的变差 b?0,b?03.设k为回归模型中的参数个数(包括截距项),则总体线性回归模型进行显著性检验时所用的F统计量可表示为()。 ??Y)2(n?k)?(YiA. ?ei2(k?1)??Y)2(k?1)?(Yi2?e(n?k) i B. (1?R2)(n?k)R2(k?1)22(1?R)(n?k)R(k?1) C. D.R2(n?k)2(1?R)(k?1) E. 17 7.在多元线性回归分析中,修正的可决系数R与可决系数R之间()。 A.R 三、名词解释 偏回归系数;回归变差、剩余变差;多重决定系数、调整后的决定系数、偏相关系数 名词解释答案 1.偏回归系数: 2.回归变差:简称ESS,表示由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。 3.剩余变差:简称RSS,是未被回归直线解释的部分,是由解释变量以外的因素造成的影响。 4.多重决定系数:在多元线性回归模型中,回归平方和与总离差平方和的比值,也就是在被解释变量的总 2 变差中能由解释变量所解释的那部分变差的比重,我们称之为多重决定系数,仍用R表示。 5.调整后的决定系数:又称修正后的决定系数,记为R2,是为了克服多重决定系数会随着解释变量的增加而增大的缺陷提出来的, 其公式为:R222222222?e?1??(y2tt/(n?k?1)?y)/(n?1)。 6.偏相关系数:在Y、X1、X2三个变量中,当X1 既定时(即不受X1的影响),表示Y与X2之间相关关系的指标,称为偏相关系数,记做RY2.1。 四、简答 011t22tt,请叙述模型的古典假定。 1.给定二元回归模型:t解答:(1)随机误差项的期望为零,即E(ut)?0。(2)不同的随机误差项之间相互独立,即 y?b?bx?bx?ucov(ut,us)?E[(ut?E(ut))(us?E(us)]?E(utus)?0。(3)随机误差项的方差与t无关,为一个常数, 2即var(ut)??。即同方差假设。(4)随机误差项与解释变量不相关,即cov(xjt,ut)?0??(j?1,2,...,k)。 通常假定xjt为非随机变量,这个假设自动成立。(5)随机误差项ut为服从正态分布的随机变量,即 ut?N(0,?2)。(6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在 多重共线性。 2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度? 解答:因为人们发现随着模型中解释变量的增多,多重决定系数R2的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。 3.修正的决定系数R2及其作用。 解答:R2?e/n?k?1,其作用有: ?1?(1)用自由度调整后,可以消除拟合优度评价中解释变量 (y?y)/n?1?2t2t多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。 4.常见的非线性回归模型有几种情况? 解答:常见的非线性回归模型主要有: (1) 对数模型lnyt?b0?b1lnxt?ut (2) 半对数模型yt?b0?b1lnxt?ut或lnyt?b0?b1xt?ut 111?u或?b0?b1?u xyx2k(4) 多项式模型y?b0?b1x?b2x?...?bkx?u (3) 倒数模型y?b0?b1 18 KK?b0b1ty?e(5) 成长曲线模型包括逻辑成长曲线模型yt?和Gompertz成长曲线模型t 1?b0e?b1t5.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①yt?b0?b1xt?ut ②yt?b0?b1logxt?ut ③ logyt?b0?b1logxt?ut ④yt?b0/(b1xt)?ut 解答:①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。 6. 观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①yt?b0?b1logxt?ut ②yt?b0?b1(b2xt)?ut ③ yt?b0/(b1xt)?ut ④yt?1?b0(1?xt1)?ut 解答:①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。 五、计算和分析题 1.根据某地1961—1999年共39年的总产出Y、劳动投入L和资本投入K的年度数据,运用普通最小二乘法估计得出了下列回归方程: (0.237) (0.083) (0.048) ,DW=0.858 式下括号中的数字为相应估计量的标准误。 (1)解释回归系数的经济含义; (2)系数的符号符合你的预期吗?为什么? 解答:(1)这是一个对数化以后表现为线性关系的模型,lnL的系数为1.451意味着资本投入K保持不变时劳动—产出弹性为1.451 ;lnK的系数为0.384意味着劳动投入L保持不变时资本—产出弹性为0.384. (2)系数符号符合预期,作为弹性,都是正值。 2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程: b3??8.133?1.059W?0.452P?0.121A Y(8.92)(0.17)(0.66)(1.09)R2?0.95F?107.37 式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。 解答:该消费模型的判定系数R?0.95,F统计量的值F?107.37,均很高,表明模型的整体拟合程度 很高。 计算各回归系数估计量的t统计量值得:t0?8.133?8.92?0.91,t1?1.059?0.17?6.10 2t2?0.452?0.66?0.69,t3?0.121?1.09?0.11。除t1外,其余T值均很小。工资收入W的系数t检 验值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。 3.计算下面三个自由度调整后的决定系数。这里,R为决定系数,n为样本数目,k为解释变量个数。 (1)R?0.75???????n??????????k?2 (2)R?0.35???????n??????????k?3 (3)R?0.95???????n???????????k?5 解答: (1)R?1?(2)R?1? 222222n?18?1(1?R2)?1??(1?0.75)?0.65 n?k?18?2?19?1?(1?0.35)??0.04 9?3?119 (3)R2?1?4.设有模型,试在下列条件下: ①b1?b2?1 ②b1?b2。分别求出b1,b2的最小二乘估计量。 解答:当b1?b2?1时,模型变为yt?x2t?b0?b1(x1t?x2t)?ut,可作为一元回归模型来对待 31?1?(1?0.95)?0.94 31?5?1yt?b0?b1x1t?b2x2t?utb1?n?(x1t?x2t)(yt?x2t)??(x1t?x2t)?(yt?x2t)n?(x1t?x2t)2?(?(x1t?x2t))2 当b1?b2时,模型变为yt?b0?b1(x1t?x2t)?ut,同样可作为一元回归模型来对待 b1?n?(x1t?x2t)yt??(x1t?x2t)?ytn?(x1t?x2t)2?(?(x1t?x2t))2 5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程: ??125.0?15.0X?1.0X?1.5X R2?0.75 方程A:Y123??123.0?14.0X?5.5X?3.7X R?0.73 方程B:Y124其中:Y——某天慢跑者的人数 X1——该天降雨的英寸数 X2——该天日照的小时数 X3——该天的最高温度(按华氏温度) X4——第二天需交学期论文的班级数 请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么? (2)为什么用相同的数据去估计相同变量的系数得到不同的符号? 解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。 (2)出现不同符号的原因很可能是由于X2与X3高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。 6.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差): 2??10.6?28.4X?12.7X?0.61X?5.9X Yi1i2i3i4i(2.6) (6.3) (0.61) (5.9) R?0.63 n?35 要求:(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说 解答:(1)x1i是盒饭价格,x2i是气温,x3i是学校当日的学生数量,x4i是附近餐厅的盒饭价格。 (2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为x4i;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为x3i;至于其余两个变量,从一般经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以x1i是盒饭价格,x2i是气温。 2 20