第三章 统计案例
滚动训练五(§3.1~§3.2)
一、选择题
1.下列语句表示的事件中的因素不具有相关关系的是( ) A.瑞雪兆丰年 C.吸烟有害健康 考点 回归分析
题点 回归分析的概念和意义 答案 D
解析 “喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选D.
2.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
①模型Ⅰ的相关系数r为-0.98;②模型Ⅱ的相关系数r为0.80;③模型Ⅲ的相关系数r为-0.50;④模型Ⅳ的相关系数r为0.25. A.Ⅰ B.Ⅱ C.Ⅲ D.Ⅳ 考点 线性相关系数 题点 线性相关系数的应用 答案 A
解析 相关系数的绝对值越大,其相关性越强,模型Ⅰ相关系数为-0.98,其绝对值最大,相关性也最强,∴模型Ⅰ的拟合效果最好,故选A. 3.下列关于K的说法正确的是( )
A.K在任何相互独立的问题中都可以用来检验有关系还是无关系 B.K的值越大,两个事件的相关性就越大
C.K是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用 D.K的观测值的计算公式为k=
2222
2
B.名师出高徒 D.喜鹊叫喜,乌鸦叫丧
n?ad-bc?
?a+b??c+d??a+c??b+d?
考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C
解析 本题主要考查对K的理解,K是用来判断两个分类变量是否有关系的随机变量,所以A错;K的值越大,说明我们能以更大的把握认为两个分类变量有关系,不能判断相关性的大小,所以B错;D中(ad-bc)应为(ad-bc).
1
2
2
2
2
4.已知变量x与y具有相关关系,且由观测数据得到的样本数据散点图如图所示,则由该观测数据求得的回归方程可能是( )
^
A.y=-1.314x+1.520
^
B.y=1.314x+1.520
^
C.y=-1.314x-1.520
^
D.y=1.314x-1.520 考点 线性回归方程 题点 求线性回归方程 答案 B
^
^
解析 由样本数据散点图可知,回归方程中a>0,b>0,故选B. 5.下列说法中,错误说法的个数是( )
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
^
^
②回归方程y=3-7x,变量x增加1个单位时,y平均增加7个单位;
③在一个2×2列联表中,若K的观测值k=13.079,则有99.9%以上的把握认为两个变量之间有关系.
A.0 B.1 C.2 D.3 答案 B
考点 线性回归分析 题点 线性回归方程的应用
^
2
解析 数据的方差与加了什么样的常数无关,故①正确;对于回归方程y=3-7x,变量x增
^
加1个单位时,y平均减少了7个单位,故②错误;若k=13.079>10.828,则有99.9%以上的把握认为这两个变量之间有关系,故③正确.
6.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K的观测值k=6.023,则市政府认为市民收入增减与旅游愿望有关系的可信度是( ) A.90%
2
B.95%
2
C.97.5%
考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C
D.99.5%
解析 由临界值表得P(K≥5.024)≈0.025,而6.023>5.024,所以认为市民收入增减与旅游愿望有关系的可信度为97.5%.
7.高三某班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:
2
x y
24 92 15 79 23 97 19 89 16 64 11 47 20 83 16 68 17 71 13 59 ^
根据上表可得回归方程的系数b≈3.53.若某学生每周用于数学学习的时间为18小时,则可预测该学生的数学成绩(结果保留整数)是( ) A.71分 B.80分 C.74分 D.77分 考点 线性回归分析 题点 线性回归方程的应用 答案 D
解析 学生每周用于数学学习的时间的平均值
x=
24+15+23+19+16+11+20+16+17+13
=17.4(小时),数学成绩的平均值
10
^^
92+79+97+89+64+47+83+68+71+59y==74.9(分),所以a=y-bx=74.9-
10
3.53×17.4=13.478.
^
当x=18时,y=3.53×18+13.478=77.018≈77,所以预测该学生的数学成绩为77分. 8.某市通过随机询问100位市民能否做到“光盘”,得到如下的2×2的列联表:
男 女 总计
下列说法正确的是( )
不能做到“光盘” 45 30 75 能做到“光盘” 10 15 25 总计 55 45 100 A.在犯错误的概率不超过1%的前提下,认为“该市居民能做到‘光盘’与性别有关” B.在犯错误的概率不超过1%的前提下,认为“该市居民能做到‘光盘’与性别无关” C.有90%的把握认为“该市居民能做到‘光盘’与性别有关”
3
D.有90%的把握认为“该市居民能做到‘光盘’与性别无关” 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C
100×?45×15-30×10?
解析 由题设知,K=≈3.030>2.706,∴有90%的把握认为“该市居
55×45×75×25
2
2
民能做到‘光盘’与性别有关”. 二、填空题
9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据
^
收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.
零件数x(个) 加工时间y(min)
现发现表中有一个数据模糊看不清,请你推断出该数据的值为________. 考点 线性回归方程 题点 样本点中心的应用 答案 68
解析 由表知x=30,设模糊不清的数据为m, 1307+m则y=(62+m+75+81+89)=,
55因为y=0.67x+54.9, 即
307+m=0.67×30+54.9, 5
10 62 20 75 30 81 40 89 50 解得m=68.
10.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归7
1 481-6××7166^
272
分析,结果如下:x=,y=71,?xi=79,?xiyi=1 481,b=≈-1.818
27??2i=1i=1
79-6×???2?7
2,a=71-(-1.818 2)×≈77.36,则销量每增加1千箱,单位成本下降________元.
2
^
考点 线性回归分析 题点 线性回归方程的应用 答案 1.818 2
4
^
解析 由已知得y=-1.818 2x+77.36,销售量每增加1千箱,则单位成本下降1.818 2元.
11.为了调查患慢性气气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结构如下表:
吸烟 不吸烟 总计
患慢性气管炎 20 5 25 未患慢性气管炎 20 55 75 总计 40 60 100 根据列联表数据,求得K=________(保留3位有效数字),根据下表,在犯错误的概率不超过________的前提下认为患慢性气管炎与吸烟有关. 附:
2
P(K2≥k0) k0 n?ad-bc?2K=.
?a+b??c+d??a+c??b+d?
2
0.050 3.841 0.010 6.635 0.001 10.828 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 22.2 0.001
100×?20×55-20×5?
解析 K的观测值k= 40×60×25×75
2
2
≈22.2>10.828.
所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关. 三、解答题
12.某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:时)的样本数据.
(1)应收集多少位女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
5