.. .
…
教学准备
1. 教学目标
1、结合生活中的实例了解分类变量的概念,了解列联表和等高条形图的特点 2、通过实例,让学生了解独立性性检验的基本思想及其初步应用
3、理解独立性检验的基本思想,会根据K2的观测值得大小判断两个分类变量有关的可信度
2. 教学重点/难点
教学重点:独立性检验基本思想的初步应用,利用独立性检验的基本思想解决实际问题
教学难点:对独立性检验思想的理解
3. 教学用具
多媒体
4. 标签 教学过程
一、复习引入
【师】在现实生活中,会遇到各种各样的变量,如果要研究它们之间的关系,观察下面两组变量,分析在取不同的值时表示的个体有何差异? 【板演/PPT】 问题1:
(1)体重、身高、学生的学习成绩
(2)性别、国籍、信仰、是否吸烟、是否患病 【师】引导学生交流思想统一认识后回答
【生】1中每个变量取不同“值”时,表示不同个体,2中变量每取不同“值”表示个体所属不同的类别
. word. …
.. .
…
【板演/PPT】
变量:分类变量、定量变量
【师】在日常生活中存在着大量分类变量,如何判断连个分类变量是否有关系也是我们需要解决的一个重要问题。 【板演/PPT】
问题2在日常生活中,我们常常关心分类变量之间是否有关系:
例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等 【师】我们在研究两个定量变量之间的关系时,运用回归分析的基本思想进行回归分析,那么对于分类变量之间的关系该如何分析呢?
本节课就是要学习独立性检验思想在分析分类变量之间关系中的应用。 【板演/PPT】
引例1.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:
那么吸烟是否对患肺癌有影响?估计吸烟者与不吸烟者患病的可能性差异? 二、新知介绍
[1]结合具体实例,引入列联表概念 【板演/PPT】
类似于上面的表格,我们称分类变量的汇总统计表为列联表,一般我们只研究两个分类变量只取两个值,这样的列联表称作2×2列联表. 【师】由上述表格能否得出患病与吸烟有关?把握有多大?
. word. …
.. .
…
【生】引导学生根据数据进行分析 1.利用频率分布表判断;
由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响; 2.利用统计图直观判断
(1)通过三维柱形图判断两个分类变量是否有关系:
由图中能清晰看出各个频数的相对大小, 由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响;
(2)通过二维条形图判断两个分类变量是否有关系: 作出患肺癌在吸烟者与不吸烟者中的的频率条形图
. word. …
.. .
…
由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例, 可估计吸烟对患肺癌有影响.
【师】教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题. 【生】积极思考 【板书/PPT】
为研究的一般性,在列联表中用字母代替数字
【师】若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论? 【生】在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即 a/a+b≈c/c+d a(c+d) ≈ c(a+b) ad -bc ≈ 0 【师】若计算ad –bc的结果,由此可以初步得出什么结论?
【生】︱ad –bc︱越小,说明吸烟与患肺癌之间关系越弱;︱ad–bc︱越大,说明吸烟与患肺癌之间关系越强.
【师】为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量
其中n=a+b+c+d为样本容量
若假设成立,k2应该很小;若,k2很大,说明假设不成立,即两变量有关系.利用上述公式,可计算出问题中的k2的观测值为
同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大? 【板书/PPT】在假设成立的情况下,统计学家估算出如下的概率:
. word. …
.. .
…
现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99%的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基本思想,可以表述为:当
很大时,就认为两个变量有关系;否则
就认为没有充分的证据显示两个变量有关系。
【师】以上就是独立性检验的基本思想?同学们能否总结什么是独立性检验? 【生】学生思考、交流、总结 【板书/PPT】
独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下用我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出K2>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%. [2] 新知应用
【师】为了深刻的理解独立性检验思想和在生活中的应用,我们来看下列一个问题
【板书/PPT】
例2在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么围有效?
【师】 能否根据引例中的检验方式进行相关分析 【生】学生交流分析过程 【板书/PPT】
解:根据题中所给数据列出二联表
. word. …