第3讲 变量间的相关关系、统计案例
[基础题组练]
1.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系.根据一组样本数据^
(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=-5x+150,则下列结论正确的是( )
A.y与x具有正的线性相关关系
B.若r表示y与x之间的线性相关系数,则r=-5 C.当销售价格为10元时,销售量为100件 D.当销售价格为10元时,销售量为100件左右
解析:选D.由回归直线方程知,y与x具有负的线性相关关系,A错,若r表示y与x^
之间的线性相关系数,则|r|≤1,B错.当销售价格为10元时,y=-5×10+150=100,即销售量为100件左右,C错,故选D.
2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
爱好 不爱好 总计 2
男 40 20 60 女 20 30 50 总计 60 50 110 n(ad-bc)2由K=,
(a+b)(c+d)(a+c)(b+d)
110×(40×30-20×20)
算得K=≈7.8.
60×50×60×50
2
2
附表:
P(K2≥k0) k0 0.050 3.841 0.010 6.635 0.001 10.828 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关”
解析:选C.根据独立性检验的定义,由K≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
3.(2019·惠州市第二次调研)某商场为了了解毛衣的月销量y(件)与月平均气温x(℃)
2
1
之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温x/℃ 月销售量y/件 17 24 13 33 8 40 2 55 ^^^^由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣销售量约为________件.
--^^^--^
解析:由题中数据,得x=10,y=38,回归直线y=bx+a过点(x,y),且b=-2,^^
代入得a=58,则回归方程y=-2x+58,所以当x=6时,y=46.
答案:46
4.有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:
甲班 乙班 总计 优秀 10 7 17 不优秀 35 38 73 总计 45 45 90 利用列联表的独立性检验估计,则成绩与班级________(填“有关”或“无关”). 解析:成绩与班级有无关系,就是看随机变量的值与临界值2.706的大小关系. 90×(10×38-7×35)
由公式得K的观测值k=≈0.653<2.706,所以成绩与班级无
17×73×45×45
2
2
关.
答案:无关
5.(2019·广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如3
下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.
11
甲班 乙班 总计 (1)请完成上面的列联表; 优秀 10 非优秀 30 总计 110 (2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.
n(ad-bc)2参考公式与临界值表:K=.
(a+b)(c+d)(a+c)(b+d)
2
P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 2
k0 解:(1)列联表如下: 2.706 3.841 5.024 6.635 10.828 甲班 乙班 总计 (2)根据列联表中的数据,得到 优秀 10 20 30 非优秀 50 30 80 总计 60 50 110 110×(10×30-20×50)K=≈7.486<10.828.因此按99.9%的可靠性要求,不能认为
60×50×30×80
2
2
“成绩与班级有关系”.
6.(2019·广州市高中综合测试(一))某地1~10岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i=1,2,…,10)如下表:
x/岁 y/cm 1 76.5 2 88.5 3 4 5 6 7 8 9 10 96.8 104.1 111.3 117.7 124.0 130.0 135.4 140.2 对上表的数据作初步处理,得到下面的散点图及一些统计量的值.
-x -y -2∑ (xi-x) i=182.50 10-2--∑ (yi-y) ∑ (xi-x)(yi-y) i=1i=13 947.71 566.85 10105.5 112.45 (1)求y关于x的线性回归方程(线性回归方程系数精确到0.01); (2)某同学认为y=px+qx+r更适宜作为y关于x的回归方程类型,他求得的回归方^2
程是y=-0.30x+10.17x+68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?
^^^^
附:回归方程y=a+bx中的斜率和截距的最小二乘估计公式分别为:b=--
∑ (xi-x)(yi-y)i=1
-2
∑ (xi-x)i=1
nn2
^-^-
,a=y-bx.
3