第三章 综合测试题
一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求) 1.在对两个变量x, y进行线性回归分析时有下列步骤:
①对所求出的回归直线方程做出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
若根据可靠性要求能够做出变量x,y具有线性相关结论,则下列操作顺序正确的是( ) A.①②⑤③④ C.②④③①⑤ 答案 D
解析 由对两个变量进行回归分析的步骤,知选D.
2.在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:
x y 4 1 m 2 8 3 10 5 12 6 B.③②④⑤① D.②⑤④③①
^由表中数据求得y关于x的回归方程为y=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中落在回归直线下方的个数为( ) A.1 C.3 答案 B
117-1-1
解析 因为x=(4+m+8+10+12)=(34+m),y=(1+2+3+5+6)=,所以将其代5555^
入y=0.65x-1.8可得m=6,故当x=4时,y=2.6-1.8=0.8<1,在直线上方;当x=8时,y=5.2-1.8=3.4>3,在直线下方;当m=6时,y=3.9-1.8=2.1>2,在直线下方. 3.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( ) ^
A.y=x+1 ^
C.y=2x+1 答案 A
--
解析 求出样本中心(x,y)代入选项检验知选A.
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
^
B.y=x+2 ^
D.y=x-1 B.2 D.0
x y 1.99 1.5 3 4.04 4 7.5 5.1 12 6.12 18.01 对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 C.y=log2x 答案 D
解析 可以代入检验,当x取相应的值时,所求y与已知y差的平方和最小的便是拟合程度最高的.
5.(2014·湖北)根据如下样本数据
x y 3 4.0 4 2.5 5 -0.5 6 0.5 7 -2.0 8 -3.0 1
B.y=()x
21
D.y=(x2-1)
2
^^^得到的回归方程为y=bx+a,则( ) ^^
A.a>0,b>0 ^^
C.a<0,b>0 答案 B
解析 用样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中做出散点^^
图,由图可知b<0,a>0.故选B. 6.下面是一个2×2列联表
x1 x2 总计 其中a,b处填的值分别为( ) A.52 54 C.94 146 答案 A
解析 由a+21=73,得a=52,a+2=b,得b=54.故选A. ^
7.设有一个回归方程为y=3-5x,则变量x增加一个单位时( ) A.y平均增加3个单位 C.y平均增加5个单位
B.y平均减少5个单位 D.y平均减少3个单位 B.54 52 D.146 94
y1 a 2 b y2 21 25 46 总计 73 27 100 ^^B.a>0,b<0 ^^D.a<0,b<0
答案 B
解析 ∵-5是斜率的估计值,说明x每增加一个单位时,y平均减少5个单位.故选B. 8.在一个2×2列联表中,由其数据计算得K2=13.097,则其两个变量间有关系的可能性为( ) A.99% C.90% 答案 A
解析 ∵如果K2的估计值k>10.828时,就有99.9%的把握认为“x与y有关系”.故选A. 9.两个相关变量满足如下关系:
x y 10 1 003 15 1 005 20 1 010 25 1 011 30 1 014 B.95% D.无关系
两变量的回归直线方程为( ) ∧
∧
A.y=0.56x+997.4
∧
B.y=0.63x-231.2
∧
B.y=50.2x+501.4 答案 A
D.y=60.4x+400.7
^解析 利用公式b=0.56x+997.4.故选A.
^^^
10.线性回归方程y=bx+a必过( ) A.(0,0) -
C.(0,y) 答案 D
^-^-^
=0.56,a=y-bx=997.4.∴回归直线方程为y=
-
B.(x,0) --D.(x,y)
--
解析 回归直线方程一定过样本点的中心(x,y).故选D.
11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R2 答案 B
n^^^
解析 yi-y=ei,i∑ei2为残差平方和.故选B. =1
12.如果根据性别与是否爱好运动的列联表得到K2≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )
A.2.5% C.1% 答案 D
B.0.5% D.5%
解析 ∵P(K2≥3.841)≈0.05,故“判断性别与运动有关”出错的可能性为5%. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上)
13.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关). 答案 有关
解析 K2>10.828就有99.9%的理由认为两个量是有关的.
14.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:
温度(x) 溶解度(y) 0 66.7 10 76.0 20 85.0 50 112.3 70 128.0 由此得到回归直线的斜率是________. 答案 0.880 9
^解析 把表中的数据代入公式b=
≈0.880 9.
15.某考察团对全国十大城市居民人均工资收入x(千元)与居民人均消费额y(千元)进行统计^调查,y与x具有相关关系,回归方程为y=0.66x+1.562,若某城市居民人均消费额为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为________. 答案 83%
7.675解析 由7.675=0.66x+1.562,得x≈9.262,所以×100%≈83%.
9.262
16.某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:
男 女 非统计专业 14 7 统计专业 11 18 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=n(ad-bc)250×(14×18-11×7)2
=≈4.023.
(a+b)(c+d)(a+c)(b+d)25×25×21×29
因为4.023>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为
________. 答案 5%
解析 ∵查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%. 三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(10分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个) 加工的时间y(小时) 2 2.5 3 3.0 4 4.0 5 4.5 (1)在给定的坐标系(如下图)中画出表中数据的散点图;
^^^
(2)求出y关于x的线性回归方程y=bx+a,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?
解析 (1)散点图如下图:
回归直线如图中所示.
(3)将x=10代入回归直线方程, ^
得y=0.7×10+1.05=8.05(小时).