第三章 统计案例
章末综合检测(三)
(时间:120分钟,满分:150分)
一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( ) A.吸烟,不吸烟 C.是否吸烟,是否患病
B.患病,不患病 D.以上都不对
解析:选C.“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A,B都是一个分类变量所取的两个不同值.故选C.
2.某商品销售量y(单位:件)与销售价值x(单位:元/件)负相关,则其回归方程可能是( ) ^
A.y=-10x+200 ^
C.y=-10x-200
^
B.y=10x+200 ^
D.y=10x-200
^
解析:选A.由x与y负相关,可排除B,D两项,而C项中的y=-10x-200<0不符合题意,故选A.
3.两个相关变量满足如下关系:
x y 2 25 3 ● 4 50 5 56 6 64 ^根据表格已得回归方程为y=9.5x+8.8,表中有一数据模糊不清,推算该数据是( ) A.37 C.39
B.38.5 D.40.5
2+3+4+5+6
解析:选C.因为x==4,所以y=9.5×4+8.8=46.8.设模糊不清的数据
5为a,则25+a+50+56+64=5y=234,解得a=39.故选C.
4.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A.C.
aaa+bc+da+bc+d与与dc B.D.
caa+bc+da+bb+c与与ac 解析:选C.由等高条形图的解可知
aa+bc+d与c的值相差越大,|ad-bc|就越大,相关性就
1
越强.
5.在一次独立性检验中,得出列联表如下: B B 总计 A 200 180 380 A 800 总计 1 000 180+a 1 180+a a 800+a 且最后发现,没有充分证据显示两个变量A和B有关系,则a的可能值是( ) A.200 C.100
解析:选B.由表得K的观测值
(1 180+a)×(200a-180×800)k=, 380×(800+a)×(180+a)×1 000当a=200时,
(1 180+200)×(200×200-180×800)k= 380×(800+200)×(180+200)×1 000≈103.37>2.706,
此时两个变量A和B有关联; 当a=720时,
(1 180+720)×(200×720-180×800)k==0,
380×(800+720)×(180+720)×1 000
由k≤2.706知此时没有充分证据显示两个变量A和B有关联,则a的可能值是720. 6.下列关于K的说法正确的是( )
A.K在任何相互独立问题中都可以用来检验有关还是无关 B.K的值越大,两个事件的相关性就越大
C.K是用来判断两个分类变量是否有关系的,只对于两个分类变量适合 D.K的观测值k的计算公式为
2222
2
22
2
2
B.720 D.180
k=
n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
2
2
解析:选C.K是用来判断两个分类变量是否有关的,故A错;K的值越大,只能说明有更大地把握认为二者有关系,却不能判断相关性的大小,B错;D中(ad-bc)应为(ad-bc). 7.以下关于线性回归的判断,正确的个数是( )
①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C三点; ^
③已知回归直线方程为y=0.50x-0.81,则x=25时,y的估计值为11.69;
2
2
④回归直线方程的意义是它反映了样本整体的变化趋势. A.0 C.2
B.1 D.3
解析:选D.能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知只有按最^^^^^
小二乘法求得回归系数a,b得到的直线y=bx+a才是回归直线,所以①不对;②正确;将x^^
=25代入y=0.50x-0.81,得y=11.69,所以③正确;④正确.故选D.
8.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( ) A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2 C.a=2,b=3,c=4,d=5 D.a=2,b=3,c=5,d=4
解析:选D.对于A,|ad-bc|=|10-12|=2; 对于B,|ad-bc|=|10-12|=2; 对于C,|ad-bc|=|10-12|=2; 对于D,|ad-bc|=|8-15|=7.
9.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( ) A.平均数与方差 B.回归直线方程 C.独立性检验 D.概率
解析:选C.根据所学内容以及此题所提供的数据可知,要想回答性别对判断“中国进入了世界体育强国之列”是否有关系时,用独立性检验最有说服力.
10.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52
3
名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1
成绩 不及及格 总计 性别 格 男 6 14 20 女 10 22 32 总计 16 36 52 表2 视力 好 差 总计 性别 男 4 16 20 女 12 20 32 总计 16 36 52
表3
智商 偏高 正常 总计 性别 男 8 12 20 女 8 24 32 总计 16 36 52
表4
阅读量 丰不 总性别 富 丰富 计 男 14 6 20 女 2 30 32 总计 16 36 52 A.成绩 B.视力 C.智商
D.阅读量
解析:选D.结合各列联表中数据,得K2
的观测值分别为k1,k2,k3,k4. 2
2
因为k=52×(6×22-14×10)52×8
116×36×32×20=16×36×32×20,
52×(4×20-16×12)2
2
k=16×36×32×20=52×112
216×36×32×20
,
4
52×(8×24-12×8)52×96k3==,
16×36×32×2016×36×32×2052×(14×30-6×2)52×408
k4==,
16×36×32×2016×36×32×20
则k4>k2>k3>k1,所以阅读量与性别有关联的可能性最大.
11.某学校开展研究性学习活动,某同学获得一组实验数据如下:(1.99,1.5),(3,4.04),(4,7.5),(5.1,12),(6.12,18.01).对于这组数据,现在给出以下拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 C.y=log2x
2
2
2
22
1xB.y=()
212
D.y=(x-1)
2
解析:选D.本题若求R或残差来分析拟合效果,运算将很烦琐,计算量太大,可以将各组数据代入检验,发现D最接近.故选D. 12.已知x与y之间的几组数据如下表:
x y 1 0 2 2 3 1 4 3 5 3 6 4 ^^^假设根据上表数据所得线性回归方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( ) ^^
A.b>b′,a>a′ ^^
C.b<b′,a>a′
解析:选C.法一:b′=2,a′=-2,
6
^^
B.b>b′,a<a′ ^^
D.b<b′,a<a′
∑ (xi-x)(yi-y)^i=1
由公式b=求得, 6
2
∑ (xi-x)i=11^5^-^-1357
b=,a=y-bx=-×=-, 76723^^
所以b<b′,a>a′.
法二:过(1,0)和(2,2)的直线方程为y=2x-2, 画出六点的散点图,回归直线的大概位置如图所示,
5