[基
础题组练]
1.根据如下样本数据:
x y 3 4.0 4 2.5 5 0.5 6 0.5 7 0.4 8 0.1 ^^^得到的线性回归方程为y=bx+a,则( ) ^^
A.a>0,b>0 ^^
C.a<0,b>0
^^B.a>0,b<0 ^^D.a<0,b<0
^
解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以b<0,由样本点(3,4.0)及(4,^
2.5)可知a>0,故选B.
2.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y^
与x具有线性相关关系,且回归方程为y=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% C.79%
B.67% D.84%
^
解析:选D.因为y与x具有线性相关关系,满足回归方程y=0.6x+1.2,该城市居民人均工资为
x=5,所以可以估计该城市的职工人均消费水平y=0.6×5+1.2=4.2,所以可以估计该城市人均消费
4.2
额占人均工资收入的百分比为=84%.
5
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,1
若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
2
A.-1 1C. 2
B.0 D.1
^
解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.
4.(2024·黑龙江哈尔滨模拟)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:
年份(届) 学科竞赛获省级一等奖 及以上的学生人数x
2014 51 2015 49 2016 55 2017 57
被清华、北大等世界名校 录取的学生人数y 103 96 108 107 ^^^^根据上表可得回归方程y=bx+a中的b为1.35,该校2024届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为( )
A.111 C.118
B.117 D.123
--^-^-
解析:选B.因为x=53,y=103.5,所以a=y-bx=103.5-1.35×53=31.95,所以回归直线^^
方程为y=1.35x+31.95.当x=63时,代入解得y=117,故选B.
5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
愿生 不愿生 总计 2
非一线 45 13 58 一线 20 22 42 总计 65 35 100 n(ad-bc)2由K=,
(a+b)(c+d)(a+c)(b+d)
100×(45×22-20×13)得K=≈9.616.
65×35×58×42
2
2
参照下表,
P(K2≥k0) k0 下列结论正确的是( ) 0.050 3.841 0.010 6.635 0.001 10.828 A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关” D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:选C.因为K≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.
6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y^
关于x的回归直线方程:y=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
^
解析:x变为x+1,y=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
2
答案:0.245
7.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:
学生编号 数学成绩 物理成绩 给出散点图如下: 1 60 72 2 65 77 3 70 80 4 75 84 5 80 88 6 85 90 7 90 93 8 95 95
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为________.
解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.
答案:1
8.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,
666
12
6)都在曲线y=bx-附近波动.经计算∑xi=11,∑yi=13,∑xi=21,则实数b的值为________. i=1i=1i=13
2
6
2
2
6
∑x∑y1-i=1i7-i=1i解析:令t=x,则曲线的回归方程变为线性的回归方程,即y=bt-,此时t==,y=3626=
13113715
,代入y=bt-,得=b×-,解得b=. 6362375答案: 7
9.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部3
110人中随机抽取1人为优秀的概率为. 11
甲班 乙班 总计 (1)请完成上面的列联表; 优秀 10 非优秀 30 总计 110 (2)根据列联表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.
n(ad-bc)2参考公式与临界值表:K=. (a+b)(c+d)(a+c)(b+d)
2
P(K2≥k0) k0 解:(1)列联表如下: 0.100 2.706 0.050 3.841 0.025 5.024 0.010 6.635 0.001 10.828 甲班 乙班 总计 (2)根据列联表中的数据,得到 优秀 10 20 30 非优秀 50 30 80 总计 60 50 110 110×(10×30-20×50)K=≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班
60×50×30×80
2
2
级有关系”.
10.(2024·长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份 广告投入 量/万元 收益/万元 1 2 14.21 2 4 20.31 bx3 6 31.8 4 8 31.18 5 10 37.83 6 12 44.67 他们用两种模型①y=bx+a,②y=ae分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
--66x 7 y ? xiyi i=1i ? x2i=130 1 464.24 364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;
(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
^^^
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二
--
∑ (xi-x)(yi-y)
^i=1
乘估计分别为b=-2
∑ (xi-x)
i=1nn--
∑xiyi-nxyi=1^-^-=n,a=y-bx.
-22
∑xi-nxi=1
n解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
-1
(2)(ⅰ)剔除异常数据,即3月份的数据后,得x=×(7×6-6)=7.2,
5-1
y=×(30×6-31.8)=29.64.
5
5
? xiyi=1 464.24-6×31.8=1 273.44,
i=15
2
i=364-6=328. ? x2
i=1
--∑xiyi-5xy1 273.44-5×7.2×29.64206.4^i=1
b=5===3,
-2328-5×7.2×7.268.82
∑xi-5xi=1
5
^
a=y-bx=29.64-3×7.2=8.04.
^
所以y关于x的回归方程为y=3x+8.04.
^
(ⅱ)把x=18代入(ⅰ)中所求回归方程得y=3×18+8.04=62.04, 故预报值为62.04万元.
[综合题组练]
-^-