好文档 - 专业文书写作范文服务资料分享网站

多元线性回归模型的案例讲解 (2)

天下 分享 时间: 加入收藏 我要投稿 点赞

1.表1列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。

年份

Y/千克

X/元

年份

Y/千克 X/元

1992 4.18 911 1993 4.04 931 1994 4.07 1021 1995 4.01 1165 1996 4.27 1349 1997 4.41 1449 1998 4.67 1575 1999 5.06 1759 2000 5.01 1994 2001 5.17 2258 2002 5.29 2478

P1/(元/P2/(元/P3/(元/千克)

4.22 3.81 4.03 3.95 3.73 3.81 3.93 3.78 3.84 4.01 3.86 3.98

P1/(元/P2/(元/P3/(元/千克)

3.97 5.21 4.89 5.83 5.79 5.67 6.37 6.16 5.89 6.64 7.04

千克)

5.07 5.20 5.40 5.53 5.47 6.37 6.98 6.59 6.45 7.00 7.32 6.78

千克)

7.83 7.92 7.92 7.92 7.74 8.02 8.04 8.39 8.55 9.37 10.61 10.48

千克)

7.91 9.54 9.42 12.35 12.99 11.76 13.09 12.98 12.80 14.10 16.82

千克)

11.40 12.41 12.76 14.29 14.36 13.92 16.55 20.33 21.96 22.16 23.26

1980 2.78 397 1981 2.99 413 1982 2.98 439 1983 3.08 459 1984 3.12 492 1985 3.33 528 1986 3.56 560 1987 3.64 624 1988 3.67 666 1989 3.84 717 1990 4.04 768 1991 4.03 843

(1) 求出该地区关于家庭鸡肉消费需求的如下模型:

(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

所以,回归方程为:

(-2.463)(4.182)(-4.569)(1.483)(0.873)

由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。

验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC)和施瓦茨准则(SC)。若AIC值或SC值增加了,就应该去掉该解释变量。

去掉猪肉价格P2与牛肉价格P3重新进行回归分析,结果如下:

Variable C LOG(X) LOG(P1)

R-squared AdjustedR-squared S.E.ofregression Sumsquaredresid Loglikelihood

Coefficient -1.125797 0.451547 -0.372735

Std.Error 0.088420 0.024554 0.063104

t-Statistic -12.73237 18.38966 -5.906668

Prob. 0.0000 0.0000 0.0000 1.361301 0.187659 -4.218445 -4.070337 497.2843

0.980287 Meandependentvar 0.978316 S.D.dependentvar 0.027634 Akaikeinfocriterion 0.015273 Schwarzcriterion 51.51212 F-statistic

Durbin-Watsonstat 1.877706 Prob(F-statistic) 0.000000

通过比较可以看出,AIC值和SC值都变小了,所以应该去掉猪肉价格P2与牛肉价格P3这两个解释变量。所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生显着影响。

2.表2列出了中国2012年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y,资产合计K及职工人数L。

序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

工业总产值资产合计K/Y/亿元 3722.700 1442.520 1752.370 1451.290 5149.300 2291.160 1345.170 656.7700 370.1800 1590.360 616.7100 617.9400 4429.190 5749.020 1781.370 1243.070

亿元 3078.220 1684.430 2742.770 1973.820 5917.010 1758.770 939.1000 694.9400 363.4800 2511.990 973.7300 516.0100 3785.910 8688.030 2798.900 1808.440

职工人数L/万人 113.0000 67.00000 84.00000 27.00000 327.0000 120.0000 58.00000 31.00000 16.00000 66.00000 58.00000 28.00000 61.00000 254.0000 83.00000 33.00000

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 序号

工业总产值资产合计K/Y/亿元 812.7000 1899.700 3692.850 4732.900 2180.230 2539.760 3046.950 2192.630 5364.830 4834.680 7549.580 867.9100 4611.390 170.3000 325.5300

亿元 1118.810 2052.160 6113.110 9228.250 2866.650 2545.630 4787.900 3255.290 8129.680 5260.200 7518.790 984.5200 18626.94 610.9100 1523.190

职工人数L/万人 43.00000 61.00000 240.0000 222.0000 80.00000 96.00000 222.0000 163.0000 244.0000 145.0000 138.0000 46.00000 218.0000 19.00000 45.00000

设定模型为:Y?AK?L?e?

(1) 利用上述资料,进行回归分析;

(2) 回答:中国2000年的制造业总体呈现规模报酬不变状态吗? 将模型进行双对数变换如下:

1)进行回归分析: 得到如下回归结果:

于是,样本回归方程为:

(1.59)(3.45)(1.79)

从回归结果可以看出,模型的拟合度较好,在显着性水平0.1的条件下,各项系数均通过了t检验。从F检验可以看出,方程对Y的解释程度较少。

R?0.7963表明,工业总产值对数值的79.6%的变化可以由资产合计对数与职工的对数值

的变化来解释,但仍有20.4%的变化是由其他因素的变化影响的。

??0.97?1,即资产与劳动的产出弹性之和近似为1,表明???从上述回归结果看,?中国制造业在2000年基本呈现规模报酬不变的状态。下面进行Wald检验对约束关系进行

检验。

过程如下: 结果如下:

由对应概率可以知道,不能拒绝原假设,即资产与劳动的产出弹性之和为1,表明中国制造业在2000年呈现规模报酬不变的状态。

一、邹式检验(突变点检验、稳定性检验)

1.突变点检验

1995-2012年中国家用汽车拥有量(yt,万辆)与城镇居民家庭人均可支配收入(xt,元),数据见表3。

表3中国家用汽车拥有量(yt)与城镇居民家庭人均可支配收入(xt)数据

年份

y(万辆) x(元) tt年份

yt(万

辆)

2004

2005 2006 2007 2008 2009 2010 2011 2012

205.42 249.96 289.67 358.36 423.65 533.88 625.33 770.78 968.98

x(元) t1995

1996 1997 1998 1999 2000 2001 2002 2003 28.49 34.71 42.29 60.42 73.12 81.62 96.04 118.2 155.77 739.1 899.6 1002.2 1181.4 1375.7 1510.2 1700.6 2026.6 2577.4 3496.2 4283 4838.9 5160.3 5425.1 5854 6280 6859.6 7702.8

下图是关于yt和xt的散点图:

从上图可以看出,2006年是一个突变点,当城镇居民家庭人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。

H0:两个字样本(1995—2005年,2006—2012年)相对应的模型回归参数相等 H1:备择假设是两个子样本对应的回归参数不等。

在1995—2012年样本范围内做回归。 在回归结果中作如下步骤: 输入突变点:

得到如下验证结果:

由相伴概率可以知道,拒绝原假设,即两个样本(1995—2005年,2006—2012年)的回归参数不相等。所以,2006年是突变点。 2.稳定性检验

以表3为例,在用1995—2009年数据建立的模型基础上,检验当把2010—2012年数据加入样本后,模型的回归参数时候出现显着性变化。

因为已经知道2006年为结构突变点,所以设定虚拟变量:

?01995?2005 D1?12006?2012?对1995—2012年的数据进行回归分析: 做邹氏稳定性检验: 输入要检验的样本点: 得到如下检验结果:

由上述结果可以知道,F值对应的概率为0.73,所以接受原假设,模型加入2010、2011和2012年的样本值后,回归参数没有发生显着性变化。

二、似然比(LR)检验

有中国国债发行总量(DEBTt,亿元)模型如下:

其中GDPt表示国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元)。1990—2011年数据见表4。

表4国债发行总量DEBTt、GDPt、财政赤字额DEFt、年还本付息额(REPAYt)数据

1990 43.01 1992 83.86 1993 79.41 1994 77.34 1995 89.85

45.178 52.947 59.345 71.71 89.644

68.9 17.65 42.57 58.16 -0.57 82.9

28.58 2001

461.4

216.178 266.381 346.344

237.14 258.83 293.35 574.52 581.52

246.8 438.57 336.22 499.36 882.96

1991 121.74 48.624 -37.38 62.89 2002 669.68

55.52 2003 739.22 28.9

42.47 2004 1175.25 467.594

2005 1549.76 584.781

39.56 2006 1967.28 678.846 50.17 2007 2476.82 744.626 79.83 2008 3310.93 783.452

529.56 1355.03 582.42 1918.37 922.23 2352.92

1996 138.25 102.022

1997 223.55 119.625 62.83

1998 270.78 149.283 133.97 76.76 2009 3715.03 820.6746 1743.59 1910.53 1999 407.97 169.092 158.88 72.37 2010 4180.1 2000 375.45 185.479 146.49 190.07 2011

4604

894.422 2491.27 1579.82 959.333 2516.54 2007.73

对以上数据进行回归分析: 得到如下输出结果:

对应的回归表达式为:

(0.2)(2.2)(31.5)(17.8)

现在用似然比(LR)统计量检验约束GDPt对应的回归系数?1等于零是否成立。 过程如下:

输入要检验的变量名: 得到如下输出结果:

输出结果上部是关于约束GDP系数为零的F检验和LR检验。由于两种检验的相应概率均小于0.05,即拒接原假设,GDP系数?1不为零,模型中应该保留解释变量GDP。 输出结果下部是去掉了GDP变量的约束模型估计结果。

三、Wald检验(以表4为例进行Wald检验,对输出结果进行检验。)

检验过程如下: 输入约束表达式: 得到如下结果:

从输出结果上部可以看出,相应概率非常大,远远大于0.05,表明原假设成立,即约束条件3*c(2)?c(3)成立,?2是?1的3倍。输出结果的下部给出了约束条件3*c(2)?c(3)?0的样本值和样本标准差,分别为0.04和0.48。

多元线性回归模型的案例讲解 (2)

1.表1列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。年份Y/千克X/元年份Y/千克X/元19924.1891119934.0493119944.07102119954.01116519964.271349
推荐度:
点击下载文档文档为doc格式
2hyw1317r58xzko02xoc4ddq3430jm00ydb
领取福利

微信扫码领取福利

微信扫码分享