应用回归题第3析课后章11题分习
3.11研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据如表3-9所示。
编号
货运总量y(万吨) 工业总产值x1(亿
元)
农业总产值x2(亿
元)
居民非商品支出x3
(亿元)
1 160 70 35 1.0
2 260 75 40 2.4
3 210 65 40 2.0
4 265 74 42 3.0
5 240 72 38 1.2
6 220 68 45 1.5
7 275 78 42 4.0
8 160 66 36 2.0
9 275 70 44 3.2
10 250 65 42 3.0
(1)计算出y,x1,x2,x3的相关系数矩阵。
所以y,x1,x2,x3的相关系数矩阵为:
0.5560.7310.724??1??0.55610.1130.398?? ?0.7310.11310.547????0.7240.3980.5471???
(2)求y关于x1,x2,x3的三元线性回归方程。
由系数表可以知道,y关于x1,x2,x3的三元线性回归方程为:
y?3.574x1?7.101x2?12.447x3?348.280
(3)对所求得的方程作拟合优度检验。
由模型汇总可知,样本的决定系数为0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。 (4)对回归方程作显著性检验。
对方差分析表可以知道p值为0.015<0.05 说明自变量x1,x2,x3对因变量y产生的线性影响较显著。而F=8.283>F0.05?4.74时,就拒绝原假设,认为在显著性水平0.05下,y与x1,x2,x3有显著的线性关系,即回归方程是显著的。 (5)对每一个回归系数作显著性检验。
由系数表可以知道,x1,x2的P值分别为0.1和0.049说明回归系数较显著,
x3的P值为0.284>0.05说明x3的回归系数不显著,应该予以剔除。
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。
由系数表可以知道,重新建立的回归方程:y1?4.676x1?8.971x2?459.624 由方差分析表可知,P值为0.07说明自变量x1,x2对因变量y产生的线性影响较显著。
由系数表可知,此时各个回归系数的P值均很小,说明回归系数的显著性较高。
(7)求出每一个回归系数的置信水平为95%的置信区间。
由上表可知,x1的系数的95%的置信区间为(0.381,8.970) x2的系数的95%的置信区间为(3.134,14.808) (8)求标准化回归方程。
由系数表可知,标准化后的回归方程为y?0.479x1?0.676x2?6.441*10?6
?0,给定置信水平为95%,用SPSS(9)求当x01=75,x02=42,x03=3.1时的y软件计算精确置信区间,手工计算近似预测区间。
?0=267.8 y0的置信水平为95%的置信区间为(260.05895,由上表可知,y334.12038)
E?y0?的置信水平为95%的近似区间估计为(241.63377,298.54556)
(10)结合回归方程对问题作一些基本分析。
对于前面的分析,虽然R方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。
当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量y有显著影响,因此还需对回归系数进行检验。