好文档 - 专业文书写作范文服务资料分享网站

备战2024年高考文数一轮复习第二节 变量的相关性与统计案例 

天下 分享 时间: 加入收藏 我要投稿 点赞

第二节 变量的相关性与统计案例

[考纲要求]

1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.

2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).

3.了解回归分析的思想、方法及其简单应用. 4.了解独立性检验的思想、方法及其初步应用.

突破点一 回归分析

[基本知识]

1.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.

(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关

回归直线 从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线 --?xiyi-nx yn回归方程 ^^^^回归方程为y=bx+a,其中b=i=1i=1?xi2-nx2n^-^-, a=y-bx -最小二乘法 2通过求Q=? ?yi-bxi-a?的最小值而得到回归直线的方法,即使得样本数据i=1n的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法 当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关. 相关系数 r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性

[基本能力]

一、判断题(对的打“√”,错的打“×”)

(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( ) (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )

1

答案:(1)× (2)√ (3)√ 二、填空题

^^^

1.已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为y=0.95x+a,则a=________.

x y 答案:2.6

2.两个变量y与x的回归模型中,分别选择了4个不同模型,经计算得到它们的相关系数r的值如下表,其中拟合效果最好的模型是________.

模型 r 答案:模型1

1010

^^^

3.已知变量x,y之间具有线性相关关系,其回归方程为y=-3+bx,若?xi=17, ?yi=4,则b的值为________.

i=1

i=1

0 2.2 1 4.3 3 4.8 4 6.7 模型1 0.98 模型2 0.80 模型3 0.50 模型4 0.25 答案:2

[全析考法]

考法一 相关关系的判断

[例1] (1)(2024·福建泉州月考)在下列各图中,两个变量具有相关关系的图是( )

A.①② C.②③

B.①③ D.②④

(2)(2024·昆明一中一模)若对于变量x的取值为3,4,5,6,7时,变量y对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u的取值为1,2,3,4时,变量v对应的值依次分别为2,3,4,6,则变量x和y,变量u和v的相关关系是( )

A.变量x和y是正相关,变量u和v是正相关 B.变量x和y是正相关,变量u和v是负相关 C.变量x和y是负相关,变量u和v是负相关 D.变量x和y是负相关,变量u和v是正相关

[解析] (1)①为函数关系;②为正相关关系;③为负相关关系;④没有明显相关性.

(2)变量x增加,变量y减少,所以变量x和y是负相关;变量u增加,变量v增加,所以变量u和v是正相关,故选D. [答案] (1)C (2)D

2

[方法技巧]

判断相关关系的2种方法

(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.

(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.

考法二 线性回归分析

[例2] (2024·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

为了预测该地区2024年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至^

2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根据2010年至2016年的^

数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.

(1)分别利用这两个模型,求该地区2024年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

^

[解] (1)利用模型①,可得该地区2024年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).

^

利用模型②,可得该地区2024年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:

(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性^

模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.

(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

3

(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分) [方法技巧]

1.回归直线方程中系数的2种求法 ^^

(1)公式法:利用公式,求出回归系数b,a.

--

(2)待定系数法:利用回归直线过样本点中心(x,y)求系数. 2.回归分析的2种策略

(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值. ^

(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数b.

[集训冲关]

1.[考法一]四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:

^

①y与x负相关且y=2.347x-6.423; ^

②y与x负相关且y=-3.476x+5.648; ^

③y与x正相关且y=5.437x+8.493; ^

④y与x正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② C.③④

B.②③ D.①④

解析:选D 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④. 2.[考法二]二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:

使用年数x 售价y z=ln y z关于x的折线图,如图所示: 2 20 3.00 3 12 2.48 4 8 2.08 5 6.4 1.86 6 4.4 1.48 7 3 1.10

(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;

^^

(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少.(b,a小数点后保留两位有效数字)

4

n

i? ?x--

i-x??yi-y?

?n

xy--

ii-nx y

=1

i=1

参考公式:^

b=

=,^a=-y-^b-n

x, -

i? ?x-

i-x?2

i?n

x2i-nx 2

=1

=1

n

x--

i? ?i-x??yi-y?

=1

r=

.

?n

?x-x?2?n ?y-

i-i-y?2

i=1

i=1

参考数据:?6x66

iyi=187.4,?xiizi=47.64,?x2i=139,

i=1

=1

i=1

6

x-

6

i? ?i-x?2=4.18,

? ?y-

=1

ii-y?2=13.96,

=1

?6

?z-

ii-z?2=1.53,ln 1.46≈0.38.

=1

解:(1)由题意,知-x=1

6×(2+3+4+5+6+7)=4.5,

-z=1

6×(3+2.48+2.08+1.86+1.48+1.10)=2,

又?6

x6

izi=47.64,

? ?x4.18,

i=1ii-x?2==1

6

?2=1.53,

i? ?z=1

i-z∴r=

47.64-6×4.5×24.18×1.53

=-6.36

6.395 4≈-0.99,

∴z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.(2)^b=47.64-6×4.5×2

6.36139-6×4.52=-17.5≈-0.36, ∴^a=-z-^b-

x=2+0.36×4.5=3.62, ∴z与x的线性回归方程是^

z=-0.36x+3.62, 又z=ln y,∴y关于x的回归方程是^y=e-0.36x+

3.62. 令x=9,得^y=e-0.36×9+

3.62=e0.38, ∵ln 1.46≈0.38,∴^

y=1.46,

即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.

突破点二 独立性检验

5

备战2024年高考文数一轮复习第二节 变量的相关性与统计案例 

第二节变量的相关性与统计案例[考纲要求]1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).3.了解回归分析的思想、方法及其简单应用.4.了解独立性检验的思想、方法及其初步应用.
推荐度:
点击下载文档文档为doc格式
1iyep8hxtl1xu1x81dzc4m0xd0pwbf00nlr
领取福利

微信扫码领取福利

微信扫码分享