.
第七章 相关分析与回归分析
例1、有10个同类企业的固定资产和总产值资料如下: 企业编号 1 2 3 4 5 6 7 8 9 10 合计 固定资产(万元) 318 910 200 409 514 502 314 1210 1022 1225 6525 总产值(万元) 524 1019 638 815 913 928 605 1516 1219 1624 9801 根据以上资料计算(1)协方差和相关系数;(2)建立以总产值为因变量的一元线性回归方程;(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少?
解:计算表如下: 固定资产x 318 910 200 409 514 502 314 1210 1022 1225 6525 总产值y 524 1019 638 815 913 928 605 1516 1219 1624 9801 x2 101124 828100 40000 167281 172225 252004 98596 1464100 1044484 1500625 5668539 y2 274576 1038361 407044 664225 833569 861184 366025 2298256 1485961 1637376 10866577 xy 166632 927290 127600 333335 387895 465856 189970 1834360 1245818 1989400 7659156 (1)协方差——用以说明两指标之间的相关方向。
??2xy(x?x)(y?y)n?xy??x?y???nn210?7659156?6525?9801?126400.35?0
100计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。
r?n?xy??x?y[n?x2?(?x)2][n?y2?(?y)2]精品
.
?10?7659156?6525?9801(10?5668539?6525)?(10?10866577?9801)22?0.95
计算得到的相关系数为0.95,表示两指标为高度正相关。
(3)
b??
n?xy??x?y10?7659156?6525?9801 ?222n?x?(?x)10?5668539?652576591560?6395152512640035??0.90
56685390?425756251410976598016525?0.9??392.85 1010??392.85?0.9x 回归直线方程为: ya?y?bx?(4)当固定资产改变200万元时,总产值平均改变多少?
?y?0.9?x,?y|?x?200?0.9?200?180万元
当固定资产改变200万元时,总产值平均增加180万元。
(5)当固定资产为1300万元时,总产值为多少?
y|x?1300?392.85?0.9?1300?1562.85万元
当固定资产为1300万元时,总产值为1562.85万元。
例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。
1 2 3 4 5 6 7 8 9 10 11 资产总值(万元) 300 400 400 500 500 500 600 600 600 700 700 平均每昼夜加工量(千吨) 0.5 0.5 0.7 0.5 0.7 0.9 0.7 0.9 1.1 0.9 1.1 企业数 4 6 3 2 5 7 2 2 3 1 7 解:【分析】本题中“企业数”应看成资产总值和平均每昼夜原料加工量两变量的次数,在计算相关系数的过程,要进行“加权”。 计算列表如下: 资产总值x(万元) 平均每昼夜加工量y(千吨) 企业数f(个) xf yf xyf x2f y2f 精品
.
300 400 400 500 500 500 600 600 600 700 700 合计 相关系数
0.5 0.5 0.7 0.5 0.7 0.9 0.7 0.9 1.1 0.9 1.1 — 4 6 3 2 5 7 2 2 3 1 7 42 1200 2400 120 1000 2500 3500 1200 1200 1800 700 4900 21600 2.0 3.0 2.1 1.0 3.5 6.3 1.4 1.8 3.3 0.9 7.7 33.0 600 1200 840 500 1750 3150 840 1080 1980 630 5390 17960 360000 960000 480000 500000 1250000 1750000 720000 720000 1020000 490000 3430000 11740000 1.00 1.50 1.47 0.50 2.45 5.67 0.98 1.62 3.63 0.81 8.47 28.1 r??f?xyf??xf?yf[?f?xf?(?xf)][?f?yf?(?yf)]2222?42?17960?21600?33(42?11740000?21600)?(42?28.1?33)22?0.84
例3、检查5位同学统计学的学习时间与成绩分数如下表:
学习时数x 4 6 7 10 13 学习成绩y 40 60 50 70 90 要求:(1)编制直线回归方程;(2)由此计算出学习时数与学习成绩之间的相关系数。 解:先列出计算表: 学习时数x 4 6 7 10 13 40 解:(1)yc?a?bx
学习成绩y 40 60 50 70 90 310 x2 16 36 49 100 169 370 xy 160 360 350 700 1170 2740 y2 1600 3600 2500 4900 8100 20700 b?n?xy??x?y5?2740?40?310??5.2 222n?x?(?x)5?370?4031040?5.2??20.455精品
a?y?bx?.
回归直线方程为:
yc?20.4?5.2x
(2)
r?n?xy??x?y[n?x2?(?x)2][n?y2?(?y)2]?5?2740?40?310(5?370?402)?(5?20700?3102)?1300?0.956
15.81?86.02计算得到的相关系数为0.95,表示两指标为高度正相关。
r?r2?0.9135?0.956
说明学习时数x与成绩得分y之间有高度的相关关系。 例3、检查5位同学统计学的学习时间与成绩分数如下表: 学习时数x 4 6 7 10 13 学习成绩y 40 60 50 70 90 要求:(1)编制直线回归方程;(2)计算估计标准误差;(3)对学习成绩的方差进行分解分析,指出总误差平方和中有多少比重可由回归方程来解释;(4)由此计算出学习时数与学习成绩之间的相关系数。 解:先列出计算表: 学习时数x 4 6 7 10 13 40 解:(1)yc?a?bx
学习成绩y 40 60 50 70 90 310 x2 16 36 49 100 169 370 xy 160 360 350 700 1170 2740 y2 1600 3600 2500 4900 8100 20700 b?n?xy??x?y5?2740?40?310??5.2 222n?x?(?x)5?370?4031040?5.2??20.4 55a?y?bx?回归直线方程为:
yc?20.4?5.2x精品
.
(2)Syx??y2?a?y?b?xy20700?20.4?310?5.2?2740??6.53
n?23(3)总误差分解列表如下: 学习时数x 4 6 7 10 13 40 学习成绩y 40 60 50 70 90 310 yc 41.2 51.6 56.8 72.4 88.0 — y?y (y?y)2 y?yc (y?yc)2 yc?y (yc?y)2 -22 -2 12 8 28 — 484 4 144 64 784 1480 -1.2 8.4 -6.8 -2.4 2.0 — 1.44 70.56 46.24 5.76 4.00 -20.8 -10.4 -5.2 10.4 26.0 — 432.64 108.16 27.04 108.16 676.00 1352.00 y?310?63 522cc?(y?y)??(y?y)??(y1480=128+1352
?y)2
r2(y?y)???(y?y)c22?1352?0.9135 1480计算总误差平方和中有91.35%可以由回归方程来解释,学习时数x与成绩得分y之间有高度的相关。如果用理论分数yc来估计实际分数y,平均将发生6.53分的误差,这个数字与平均成绩62分对比约占10.5%。 (4)r?r2?0.9135?0.956
说明学习时数x与成绩得分y之间有高度的相关关系。
如有侵权请联系告知删除,感谢你们的配合!
精品