1-1-3 回归分析的基本思想及其初步应用(一)
基础要求
1.在画两个变量的散点图时,下面叙述正确的是( ) A.预报变量在x轴上,解释变量在y轴上 B.解释变量在x轴上,预报变量在y轴上 C.可以选择两个变量中任意一个变量在x轴上 D.可以选择两个变量中任意一个变量在y轴上 答案:B
2.在对两个变量x,y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.
如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ C.②④③①⑤
解析:根据线性回归分析的思想可得. 答案:D
3.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图2),以下结论中正确的是( )
B.③②④⑤① D.②⑤④③①
图2
A.x和y的相关系数为直线l的斜率 B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同 D.直线l过点(x,y)
解析:解法1:由于线性回归方程可设为y=a+bx,而系数a的计算公式为a=y-bx,
1
故应选D.
解法2:依据最小二乘法的有关概念:样本点的中心,相关系数,线性回归方程的意义等进行判断,如下表格,故应选D. 选项 A 具体分析 相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同 相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量负相关 结论 不正确 B C 不正确 不正确 l两侧的样本点的个数分布与n的奇偶性无关,也不一定是平均分布 ^回归直线l一定过样本点中心(x,y);由回归直线方程的计算公式a D ^正确 =y-b x可知直线l必过点(x,y) 答案:D 4.观测两相关变量得如下数据
x y -1 -1.1 -2 -1.9 -3 -2.9 -4 -4.1 -5 -5 5 5 4 4.1 3 2.9 2 1.9 1 1.1 则两变量x,y间的回归直线必过点________. 解析:回归直线必过点(x,y),而x=0,y=0. 答案:(0,0)
5.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:
^
y =0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加
____________万元.
解析:对于已给出的回归直线方程,对其回归系数的意义和回归方程实际应用价值应重点掌握.
∵家庭年收入增加1万元,即Δx=x2-x1=1万元
^
^
则年饮食支出Δy=y 2-y 1=0.254x2+0.321-0.254x1-0.321=0.254Δx=0.254万元
答案:0.254
能力要求
1.某地2009年第二季度月平均气温x(℃)与某户用水量y(吨)如下表,根据表中数据,
2
用最小二乘法求得用水量y关于月平均气温x的线性回归方程是( )
月份 月平均气温 月用水量 ^
4 20 15 ^5 25 20 6 30 28 A.y =5x-11.5
^
B.y =6.5x-11.5
^
C.y =1.2x-11.5 D.y =1.3x-11.5
解析:∵x=25,y=21,而选项A、B、C中的直线不过点(25,21),排除A、B、C,选D.
答案:D
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2 B.0 解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关;对于变量V与U而言,V随U的增大而减小,故V与U负相关,由上可知r1>0,r2<0,∴r2<0 答案:C 3.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系: 时间x 命中率y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4 小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________. 解析:由题意可得 x=3,y=0.5. ^ ^ a =y-b x=0.5-0.01×3=0.47. ^ ^ y=b x+a =0.01×6+0.47=0.53. 3