好文档 - 专业文书写作范文服务资料分享网站

18-19 第1章 1.2 独立性检验的基本思想及其初步应用

天下 分享 时间: 加入收藏 我要投稿 点赞

1.2 独立性检验的基本思想及其初步应用

学习目标:1.理解独立性检验的基本思想及其实施步骤.(重点)2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)3.了解K2的含义及其应用.(重点)4.通过对数据的处理,来提高解决实际问题的能力.(难点)

[自 主 预 习·探 新 知]

1.分类变量及2×2列联表 (1)分类变量

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表

①定义:列出的两个分类变量的频数表,称为列联表.

②2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

x1 x2 总计 2.等高条形图 (1)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.

(2)观察等高条形图发现关系.

3.独立性检验

(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.

n?ad-bc?2

(2)K=,其中n=a+b+c+d.

?a+b??c+d??a+c??b+d?

2

y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d ac和相差很大,就判断两个分类变量之间有a+bc+d(3)独立性检验的具体做法

①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率

第 1 页

的上界α,然后查表确定临界值k0. ②利用公式计算随机变量K2的观测值k.

③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.

思考:有人说:“我们有99%的把握认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?

[提示]观点不正确.99%的把握说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.

[基础自测]

1.思考辨析

(1)在独立性检验中,若K2越大,则两个分类变量有关系的可能性越大. (2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.

( )

(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.

[答案] (1)√ (2)√ (3)×

2.下列变量中不属于分类变量的是( )

【导学号:48662019】

A.性别 C.宗教信仰

B.吸烟 D.国籍

( )

B [“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.] 3.下面是一个2×2列联表:

x1 x2 总计 y1 a 8 b y2 21 25 46 总计 73 33 则表中a,b处的值分别为________. 第 2 页

52,60 [∵a+21=73,∴a=52. b=a+8=52+8=60.] 4.根据下表计算: 男 女 不看电视 37 35 看电视 85 143 K2的观测值k≈________(保留3位小数). 【导学号:48662019】

300×?37×143-85×35?2

4.514 [k=≈4.514.]

122×178×72×228

[合 作 探 究·攻 重 难]

用2×2列联表分析两变量间的关系 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用c

判断二者是否有关系. c+d

[解] 2×2列联表如下:

饮食以蔬菜为主 饮食以肉类为主 总计 将表中数据代入公式得c27

=60=0.45. c+d

年龄在六十岁以上 43 27 70 a43=64=0.671 875. a+b

年龄在六十岁以下 21 33 54 总计 64 60 124 a与a+b

第 3 页

显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.

[规律方法] 1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误. 2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2ac?或b与d???的值相比,直观地列联表,然后根据频率特征,即将与a+bc+d?a+bc+d?反映出两个分类变量间是否相互影响,但方法较粗劣. [跟踪训练] 1.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:

x1 x2 y1 10 m y2 18 26 则当m取下面何值时,X与Y的关系最弱( ) A.8 C.14

B.9 D.19

C [由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.]

用等高条形图分析两变量间的关系 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:

组别 铅中毒病人 对照组 总计 阳性数 29 9 38 阴性数 7 28 35 总计 36 37 73 试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?

第 4 页

【导学号:48662019】

[解] 等高条形图如图所示:

其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.

由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.

[规律方法] 利用等高条形图判断两个分类变量是否相关的步骤: [跟踪训练] 2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:

药物效果试验列联表

服用药 没有服用药 总计 患病 10 20 30 未患病 45 30 75 总计 55 50 105 试用图形判断服用药与患病之间是否有关系? [解] 相应的等高条形图如下:

从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系.

用K2进行独立性检验 [探究问题] 1.在K2运算后,得到K2的值为29.78,在判断变量相关时,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪种说法是正确的?

提示:两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(K2≥7.879)≈0.005的含义是在犯错误

第 5 页

18-19 第1章 1.2 独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用学习目标:1.理解独立性检验的基本思想及其实施步骤.(重点)2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)3.了解K2的含义及其应用.(重点)4.通过对数据的处理,来提高解决实际问题的能力.(难点)[自主预习·探新知]1.分类变量及2×2列联表(1)分类变量变量的不
推荐度:
点击下载文档文档为doc格式
8usdo7zz0i0a6ri16ozy38gut0xt46013v3
领取福利

微信扫码领取福利

微信扫码分享