专题十一 概率与统计
第三十三讲 回归分析与独立性检验
一、选择题
1.(2017山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关
系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相
??4.??a??bx?.关关系,设其回归直线方程为y已知?xi?225,?yi?1600,b该
i?1i?11010班某学生的脚长为24,据此估计其身高为
A.160 B.163 C.166 D.170
2.(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户
家庭,得到如下统计数据表:
收入x(万元) 支出y(万元) 8.2 8.6 10.0 11.3 11.9 6.2 7.5 8.0 8.5 9.8 ??a??0.76,a? ,据此估计,该社??bx? ,其中b??y?bx根据上表可得回归本线方程y区一户收入为15万元家庭年支出为
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 3.(2014重庆)已知变量x与y正相关,且由观测数据算得样本的平均数x?3,y?3.5,
则由该观测数据算得的线性回归方程可能为
A.$y?0.4x?2.3 B.$y?2x?2.4 C.$y??2x?9.5 D.$y??0.3x?4.4 4.(2014湖北)根据如下样本数据
x y
3 4.0 4 2.5 5 ?0.5 6 0.5 7 ?2.0 8 ?3.0 ??bx?a,则 得到的回归方程为yA.a?0,b?0 B.a?0,b?0 C.a?0,b?0 D.a?0,b?0 5.(2012新课标)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不
全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y?这组样本数据的样本相关系数为
1
A.?1 B.0 C. D.1
2
1x?1上,则26.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关
系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是
7.(2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关
系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为
$的是 y=0.85x?85.71,则下列结论中不正确...
A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(x,y)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg 8.(2011山东)某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54
?为9.??a??bx?中的b根据上表可得回归方程y4,据此模型预报广告费用为6万元时销
售额为
A.63.6万元
B.65.5万元
C.67.7万元
D.72.0万元
二、解答题
9.(2024全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)
的折线图.
为了预测该地区2024年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,,2…,17)建立模
???30.4?13.5t;根据2010年至2016年的数据(时间变量t的值依次为型①:y??99?17.5t. 1,2,…,7)建立模型②:y(1)分别利用这两个模型,求该地区2024年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
10.(2016年全国III)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)
的折线图