(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.
(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.
利用计算器容易求得回归方程y=-2.352x+147.767.
(4)当x=2时,y=143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮. 思考
气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下: 1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.
2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=y+e.
这里e是随机变量,预报值y与实际值y的接近程度由随机变量e的标准差所决定.
一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.
例2 下表为某地近几年机动车辆数与交通事故数的统计资料.
第36页 共171页
^^^^
机动车辆数x/千台 交通事故数y/千件 95 110 112 120 129 135 150 180 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13 (1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;
(2)如果具有线性相关关系,求出线性回归方程. 解:(1)在直角坐标系中画出数据的散点图,如下图.
直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:
?xi?188i=1 031,?yi=71.6,
i?18?xi?12i=137 835,?xiyi=9 611.7.
i?18将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.
思路2
例1 给出施化肥量对水稻产量影响的试验数据: 施化肥量15 x 第37页 共171页
20 25 30 35 40 45
水稻产量330 y (1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.
345 365 405 445 450 455
(2)表中的数据进行具体计算,列成以下表格: i xi yi xiyi 1 15 330 4 950 2 20 345 6 900 72i3 25 365 9 125 74 30 405 5 35 445 6 40 450 7 45 455 12 150 15 575 18 000 20 475 2i7x?30,y?399.3,?x?7000,?y?1132725,?xiyi?87175 i?1i?1i?1故可得到 b=
87175?7?30?399.3≈4.75,
7000?7?302a=399.3-4.75×30≈257.
从而得回归直线方程是y=4.75x+257.
例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下: 零件个数x10 20 30 40 50 60 70 80 90 100 ^第38页 共171页
(个) 加工时间y(分) 请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程.
解:在直角坐标系中画出数据的散点图,如下图.
62 68 75 81 89 95 102 108 115 122
直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:
x?55,y?91.7,?x=38 500,?y=87 777,?xiyi=55 950.
2i2ii?1i?1i?1101010b=
?xyii?11010i?10xy??10x2?xi?12i55950?10?55?91.7≈0.668.
38500?10?552a=y?bx=91.7-0.668×55≈54.96.
因此,所求线性回归方程为y=bx+a=0.668x+54.96.
例3 已知10条狗的血球体积及红血球数的测量值如下: 血球体积x(mL) 45 红血球数y(百万) 6.53 42 6.30 46 9.52 48 7.50 42 6.99 35 5.90 58 9.49 40 6.20 39 6.55 50 8.72 ^(1)画出上表的散点图; (2)求出回归直线的方程.
第39页 共171页
解:(1)散点图如下.
(2)x?y?1(45+42+46+48+42+35+58+40+39+50)=44.50, 101(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 10^设回归直线方程为y=bx+a,则b=
?xyii?11010i?10xy=0.175,a=y?bx=-0.418,
?10x2?xi?12i所以所求回归直线的方程为y=0.175x-0.148.
点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数x,y;计算xi与yi的积,求∑xiyi;计算∑xi2;将结果代入公式求b;用a=y?bx求a;写出回归直线方程. 知能训练
1.下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的余弦值 B.正方形边长和面积 C.正n边形的边数和它的内角和 D.人的年龄和身高 答案:D
2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A.y=5.75-1.75x B.y=1.75+5.75x
第40页 共171页
^^^