§1.2独立性检验的基本思想及其应用(一)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:
理解分类变量的含义;会根据收集的数据列出2×2列联表,并会阅读三维柱形图和二维条形图,并粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有关系;
(2)过程与方法:
利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法; (3)情感态度与价值观:
通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:
理解独立性检验的基本思想及实施步骤。
【教学难点】:.
(1)了解独立性检验的基本思想;
(2)了解随机变量K的含义,K太大认为两个分类变量是有关系的。
22【课前准备】:
课件
【教学过程设计】: 教学环节 一、问题引入 教学活动 1. 介绍分类变量的概念:变量的不同”值”表示个体所属的不同类别,如性别变量男女,是否吸烟,宗教信仰,国籍等. 2. 在日常生活中,我们关心两个分类变量之间是否有关系,如:吸烟是否与患肺癌有关? 引例.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965 设计意图 为探索新知识做准备. 那么吸烟是否对患肺癌有影响?
二、探究新知 教师引导:统计学中一般采取什么方式手段研究分析解决问题? 如何运用统计学的方法进行分析判断? 学生探究: 1.利用频率分布表判断; 不吸烟 吸烟 不患肺癌 99.46% 97.72% 患肺癌 0.54% 2.28% 总计 1 1 由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响; 2. 利用统计图直观判断 (1)通过三维柱形图判断两个分类变量是否有关系: 8000 7000 6000 5000 4000系列1 3000系列22000 S21000 0 S112 由图中能清晰看出各个频数的相对大小, 由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响; (2)通过二维条形图判断两个分类变量是否有关系: 作出患肺癌在吸烟者与不吸烟者中的的频率条形图 患肺癌 比例 不患肺癌 比例 不吸烟 吸烟 由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例, 可估计吸烟对患肺癌有影响. 教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有 10.90.80.70.60.50.40.30.20.10不吸烟吸烟鼓励学生自己寻找研究问题的一般统计学的方法 通过图表的方法,使学生巩固统计学中一般研究问题的基本思路。
关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题. 师生共同探究: 为研究的一般性,在列联表中用字母代替数字 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 利用独立事件同时 发生的概率公式启师:若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论? 发学生做出假设 生:在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即 a/a+b≈c/c+d a(c+d) ≈ c(a+b) ad -bc ≈ 0 师:若计算ad –bc的结果,由此可以初步得出什么结论? 生:︱ad –bc︱越小,说明吸烟与患肺癌之间关系越弱; ︱ad –bc︱越大,说明吸烟与患肺癌之间关系越强. 师:为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量 n(ad?bc)22K? 其中 n?a?b?c?d为样本容量 (a?b)(c?d)(a?c)(b?d) 22若假设成立,K应该很小;若K很大,说明假设不成立,即两变量有 2关系.利用上述公式,可计算出问题中的K的观测值为 2 9965?7775?49?42?2099? k??56.632 7817?2148?9874?91 同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大? 在假设成立的情况下,统计学家估算出如下的概率: P(K2?6.635)?0.01 现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概 率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99% 的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的 采用类比的方法,n(ad?bc)22基本思想,可以表述为:当K? 便于学生理解假设(a?b)(c?d)(a?c)(b?d)检验的思想 很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变 量有关系。 师:类比反证法的原理,你能否总结出独立性检验的基本步骤? 生:(1)假设两个分类变量X与Y无关系; n(ad?bc)2(2)计算出K的观测值K?; (a?b)(c?d)(a?c)(b?d)22
(3)把k的值与临界值比较确定X与Y有关的程度或无关。 三、形成方法 方法总结: 培养学生归纳的能要推断“X与Y有关系”成立的可能性的方法: 力 1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系, (1) ︱ad -bc︱ (2) a/a+b≈c/c+d 2、利用独立性检验精确判断两个分类变量是否有关系 (1)假设无关 (2)求k值 (3)下结论 1、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个变量有关系的可能性就( A ) A.越大 B.越小 C.无关系 D.无法确定 2、对于2×2列联表,在二维条形图中,两个比例的值相差越大,则 巩固知识,培养技能. 四、练习巩固 h:“x与y有关系”的可能性 越大 。 3、为了调查高中生的数学成绩和物理成绩的关系,在某校随机抽取部分学生做调查,得到下列两份图表 100??p`P@0 %0%数学好 数学差物理好物理差250200150100500数学好 数学差物理差物理好 根据以上图表,列出相应的列联表,根据图形回答,数学成绩好坏与物理成绩好坏 关系。 解:列联表如下: 数学好 数学差 物理好 80 70 物理差 120 30 合计 200 100
合计 150 150 300 根据图形,可知数学成绩好坏与物理成绩好坏 有 关系。 五、小结 反思归纳 1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系, (1) ︱ad -bc︱ (2) a/a+b≈c/c+d 2、利用独立性检验精确判断两个分类变量是否有关系 (1)假设无关 (2)求k值 (3)下结论 判断两个分类变量是否有关的方法 六、作业 P21 习题1.2 1 , 2 1为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表: 服用药 未服用药 总计 患病 10 20 30 未患病 45 30 75 总计 55 50 105 请问有多大把握认为药物有效? 2、通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表: 读营养说明 不读营养说明 总计 女 16 20 36 男 28 8 36 总计 44 28 72 请问性别和读营养说明之间在多大程度上有关系?
同步练习与测试:
(基础题)
1、根据下表计算: 男 女 不看电视 37 35 看电视 85 143 计算随机变量的观测值k= 。 解:把表格补充完整 男 女 总计 不看电视 37 35 72 看电视 85 143 228 总计 122 178 300
300(37?143?85?35)2k??4.51
72?228?122?1782、独立性检验常作的图形是 和 。 答案 :三维柱形图 ,二维条形图
3、两个临界值为3.841与6.635。当k?3.841时,认为事件A与B是 (填“有关的”或“无关的”);当k?6.635时,有99%的把握说事件A与B是 (填“有关的”或“无关的”)。 答案:无关的 ,有关的
4、用k统计量进行独立性检验时使用的表称为 ,要求表中的四个数据大于 。
答案:2?2列联表 ,5
(中等题)
5、设A为一随机事件,则下列式子中不正确的是() A.P(A?A)?P(A)?P(A) B.P(A?A)?1 C.P(A?A)?P(A)?P(A) D.P(A?A)?0 答案:选C
6、统计假设成立时,有以下判断:
222?1?P(AB)?P(A)P(B)?2?P(AB)?P(A)P(B)?3?P(AB)?P(A)P(B)
其中真命题个数是( )
A.1 B.2 C.3 D.4 答案:选C
7、设事件A与B相互独立,则(1)A和B相互独立;(2)B和A相互独立;(3)A和B相互独立,其中真命题是( ) A.(1)(2) B.(1)(3) C.(2)(3) D.(1)(2)(3) 答案:选D