1.1 回归分析的基本思想及其初步应用
A级 基础巩固
一、选择题
1.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )
A.①② C.②③
B.①③ D.③④
解析:图①,③中的点大致在一条直线附近,适合用线性回归模型拟合. 答案:B
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
^
①y与x负相关且y=2.347x-6.423; ^
②y与x负相关且y=-3.476x-5.648; ^
③y与x正相关且y=5.437x+8.493; ^
④y与x正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② C.③④
B.②③ D.①④
解析:①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确. 答案:D
3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R分别如表:
2
R2 甲 0.98 乙 0.78 丙 0.50 丁 0.85 建立的回归模型拟合效果最好的同学是( )
- 1 -
A.甲 C.丙
2
B.乙 D.丁
解析:相关指数R越大,表示回归模型的效果越好. 答案:A
4.已知x与y之间的一组数据如下表:
x y 0 1 3 2 5.5 3 7 m ^已求得y关于x的线性回归方程为y=2.1x+0.85,则m的值为( ) A.1 C.0.7
-0+1+2+33
解析:因为x==,
42-
B.0.85 D.0.5
m+3+5.5+7m+15.5
y==.
4
4
?3m+15.5?. 所以这组数据的样本中心点是?,?4??2
^
因为y关于x的线性回归方程为y=2.1x+0.85, 所以
m+15.5
43
=2.1×+0.85,解得m=0.5.
2
答案:D
5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) 支出y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8 ^^^^^-^-根据上表可得回归直线方程y=bx+a,其中b=0.76,a=y-bx.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 C.12.0万元
B.11.8万元 D.12.2万元
^
解析:先求a,再利用回归直线方程预测.
-8.2+8.6+10.0+11.3+11.9
由题意知,x==10,
5
- 2 -
-
y=
6.2+7.5+8.0+8.5+9.8
=8,
5
^
∴a=8-0.76×10=0.4,
^
∴当x=15时,y=0.76×15+0.4=11.8(万元). 答案:B 二、填空题
6.如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为________,相关指数
R2=________.
^
解析:由题意知,yi=yi ^^
∴相应的残差ei=yi-yi=0.
相关指数R=1-答案:0 1
2
7.某脑科研究机构对高中学生的记忆力x和判断力y进行统计分析,得到下表数据:
x y 6 2 8 3 10 5 12 6 ^^^^^根据上表可得回归直线方程y=bx+a,其中a=-2.3,则b=________.
-6+8+10+12-2+3+5+6
解析:由表格中数据得x==9,y==4,故样本中心点的坐标为
44(9,4),
^^
因为线性回归方程为y=bx-2.3, ^^
所以4=b×9-2.3,解得b=0.7. 答案:0.7
注:根据学生用书选用
^
8.已知方程y=0.85x-85.71是根据女大学生的身高预报她的体重的回归直线方程,其中x^
的单位是cm,y的单位是kg,那么针对某个体(160,53)的残差是________.
^
解析:将x=160代入y=0.85x-85.71, ^
得y=0.85×160-85.71=50.29 ^^
所以残差e=y-y=53-50.29=3.29.
- 3 -