课后限时集训64
变量间的相关关系、统计案例
建议用时:45分钟
一、选择题
1.(2019·泉州模拟)在下列各图中,两个变量具有相关关系的是( )
(1) (2) (3) (4)
A.(1)(2) C.(2)(4)
B.(1)(3) D.(2)(3)
D [(1)是函数关系,(4)不具有相关关系,排除A,B,C,故选D.]
2.(2019·肇庆模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y=b2x+a2,相关系数为r2.则( )
A.0<r1<r2<1 C.-1<r1<r2<0
B.0<r2<r1<1 D.-1<r2<r1<0
D [根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;
方案一中,没剔除离群值,线性相关性弱些,成负相关; 方案二中,剔除离群值,线性相关性强些,也是负相关. 所以相关系数-1<r2<r1<0.故选D.]
3.(2019·石家庄二模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
1
根据这两幅图中的信息,下列哪个统计结论是不正确的( ) A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量 C.样本中的男生偏爱两理一文 D.样本中的女生偏爱两文一理
D [由条形图知女生数量多于男生数量,有两理一文意愿的学生数量多于有两文一理意愿的学生数量,男生偏爱两理一文,女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故选D.]
4.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其线性^1^^
回归方程是y=x+a,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数a的值是
3( )
A.1 16
1B. 81D. 2
1C. 4
^1313^?33?B [依题意可知样本点的中心为?,?,则=×+a,解得a=.]
8348?48?
5.(2019·中原六校联考)某医疗所为了检查新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射疫苗的人与另外1 000名未注射疫苗的人半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算得P(χ≥6.635)≈0.01,则下列说法正确的是( )
A.这种疫苗能起到预防甲型H1N1流感的有效率为1%
B.若某人未使用疫苗则他在半年中有99%的可能性得甲型H1N1流感 C.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” D.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”
C [因为P(χ≥6.635)≈0.01,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,所以有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故选C.]
2
2
2
二、填空题
6.(2019·湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
r m 甲 0.82 106 乙 0.78 115 丙 0.69 124 丁 0.85 103 则________同学的试验结果体现A,B两变量有更强的线性相关性. 丁 [r越大,m越小,线性相关性越强.]
7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根^
据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.
零件数x/个 加工时间y/min 10 62 20 30 40 81 50 89 75 现发现表中有一个数据看不清,请你推断出该数据的值为________. 68 [由x=30,得y=0.67×30+54.9=75. 设表中的“模糊数字”为a,
则62+a+75+81+89=75×5,即a=68.]
8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ≈3.918,经查临界值表知P(χ≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
① [χ≈3.918>3.841,而P(χ≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.]
三、解答题
9.经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如表所示.
年龄x 收缩压y 28 114 32 118 38 122 42 127 48 129 52 135 58 140 62 147 2
22
2
3
(单位:mm Hg) n∑xy-nxy8^i=1ii^^2
其中b=n,a=y-bx,∑xi=17 232,
i=122
∑xi-nxi=1
8
i=1
∑xiyi=47 384.
(1)请画出表中数据的散点图;
^^^^
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(a,^
b的值精确到0.01)
(3)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180 mmHg的70岁的老人,属于哪类人群?
[解] (1)画出表中数据的散点图如图所示.
(2)x=
28+32+38+42+48+52+58+62
=45,
8
y=
114+118+122+127+129+135+140+147
=129,
8
8
∑xy-8xy^i=1ii47 384-8×45×129118∴b=8==≈0.91, 2
17 232-8×4512922
∑xi-8xi=1
4
^
a=y-bx=129-0.91×45=88.05,
^
∴回归直线方程y=0.91x+88.05.
(3)根据回归直线方程的预测,年龄为70岁的老人标准收缩压为0.91×70+88.05=151.75(mgHg),
∵
180
≈1.19, 151.75
^
且1.12<1.19<1.20,
∴收缩压为180 mmHg的70岁老人属于中度高血压人群.
10.(2019·清华大学附中三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性、300名男性)进行调查,对手机进行评分,评分的频数分布表如下: 女性 用户 男性 用户 分值区间 频数 分值区间 频数 [50,60) 20 [50,60) 45 [60,70) 40 [60,70) 75 [70,80) 80 [70,80) 90 [80,90) 50 [80,90) 60 [90,100] 10 [90,100] 30 (1)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);
(2)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为是否是评分良好用户与性别有关?
参考公式及数据:χ=
2
a+b0.10 2.706 nad-bc2
c+da+c0.05 3.841 b+d,其中n=a+b+c+d.
0.001 10.828 P(χ2≥k) k 0.01 6.635 [解] (1)女性用户和男性用户的频率分布直方图分别如下图所示:
女性用户 男性用户 由图可得女性用户的波动小,男性用户的波动大.
5
2021高考数学一轮复习课后限时集训64变量间的相关关系统计案例(含解析)



