课题:独立性检验的基本思想及其初步应用(第一课时)
教学目标:1、理解独立性检验的基本思想;
2、会从列联表、柱形图、条形图直观判断吸烟与患肺癌有关; 3、了解随机变量K2的含义。
教学重点:理解独立性检验的基本思想。 教学难点:1、理解独立性检验的基本思想;
2、了解随机变量K2的含义。
教学手段:多媒体课件。 教学方法:讲练结合。 教学过程:
一、 引入:
问题:某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业用途 根据这些数据能否断定:患肺癌与吸烟有关?
从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业用途 吸烟与肺癌列联表 吸烟 不吸烟 总计 8000 70006000 5000 4000 3000 20001000 0不患肺癌
患肺癌 49 42 91 不患肺癌 2099 7775 9874 总计 2148 7817 9965 不吸烟吸烟吸烟不吸烟患肺癌1 / 4
8000 7000 6000 5000患肺癌 不患肺癌4000 3000 2000 1000 0不吸烟吸烟 100% 90% 80% 70% 60%患肺癌50% 不患肺癌40% 30% 20% 10%0% 不吸烟吸烟 在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。
通过数据和图表分析,得到结论是:吸烟与患肺癌有关。 但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。
二、 独立性检验就是检验两个分类变量是否有关的一种统计方法: 用字母表示吸烟与患肺癌的列联表: 不患肺癌 患肺癌 合计 不吸烟 a b a+b 吸烟 c d c+d 合计 a+c b+d a+b+c+d 样本容量 n=a+b+c+d
假设H0 : 吸烟与患肺癌没有关系。则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业9000用途
2 / 4
ac??a?c?d??c?a?b??ad?bc?0a?bc?d因此 : ad?bc 越小, 说明吸烟与患肺癌之间关系越弱.n?ad?bc?2构造随机变量 k? 其中a?bc?da?cb?d????????n?a?b?c?d2
作为检验在多大程度上可以认为“两个变量有关系”的标准 。
若H0成立,则K2应该很小. 把表中数据代入公式29965?7775?49-42?2099?K=?56.6327817?2148?9874?91在H0成立的情况下.统计学家估算出如下概率2P?K2?6.635??0.01即在H0成立的情况下,K2的值大于6.635的概率非常小.如果K2?6.635,就断定H0不成立,出错的可能性有多大?出现K2=56.6326.635 的概率不超过1% .因此,我们有99%的把握认为\
三、结论: 2×2列联表 y1 y2 总计
2x1 a b a+b 2n?ad?bc? K??a?b??c?d??a?c??b?d?x2 c d c+d 总计 a+c b+d a+b+c+d P(K2?k)
1)如果P(k>10.828)= 0.001表示有99.9%的把握认为“X与Y”有关系; 2)如果P(k> 7.879)= 0.005表示有99.5%的把握认为“X与Y”有关系; 3)如果P(k> 6.635)= 0.01 表示有 99% 的把握认为“X与Y”有关系; 4)如果P(k> 5.024)= 0.025表示有97.5%的把握认为“X与Y”有关系; 5)如果P(k> 3.841)= 0.05 表示有 95% 的把握认为“X与Y”有关系; 6)如果P(k> 2.706)= 0.10 表示有 90% 的把握认为“X与Y”有关系; 7)如果P(k≤2.706) , 就认为没有充分的证据显示“X与Y” 有关系。 用 K^2 统计量研究这类问题的方法称为独立性检验。
3 / 4
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和2(如患病与不患病)。于是得到版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业用途 下列联表所示的抽样数据: 类A 类B 类1 a c 类2 b d 总计 a+b c+d 总计 a+c b+d a+b+c+d 要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0 :Ⅰ和Ⅱ没有关系;
(2)根据2× 2列表与公式计算K^2 的值; (3)查对临界值,作出判断。
由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 K^2进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业用途 四、应用举例:
例1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?版权文档,请勿用做商业用途文档来源网络及个人整理,勿用作商业用途 未感冒 感冒 合计 使用血清 未使用血清 258 216 242 284 500 500 1000 合计 474 526 五、作业:P21习题1.2的1、2和预习18页。
课后记:
4 / 4
《独立性检验的基本思想及其初步应用》教案



