1.在K2运算后,得到K2的值为29.78,在判断变量相关时,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪种说法是正确的?
提示:两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(K2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.
2.你能说一下用K2进行独立性检验的依据吗?
提示:独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.
【例3】 随着生活水平的提高,人们的休闲方式也发生了变化.某机构随2
机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是
51
运动,而女性中只有3的人的休闲方式是运动.
(1)完成下列2×2列联表:
男生 女生 总计 运动 非运动 总计 n (2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?
思路探究:(1)依据2×2列联表的定义填表; (2)计算K2,利用临界值建立不等关系,求n的值. [解] (1)补全2×2列联表如下:
男性 女性 总计 运动 15n 15n 25n 非运动 15n 25n 35n 总计 25n 35n n (2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有6
关”,则P(K2≥k0)=3.841.
2
?n2nnn?
?n?5·5-5·5??n
由于K2的观测值k=2n3n2n3n=36,
5·5·5·5
n
故36≥3.841,即n≥138.276. 1
又由5n∈Z,故n≥140.
故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.
1.(变结论)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动? 2[解] 根据(2)的结论,本次被调查的人中,至少有5×140=56(人)的休闲方式是运动. 2.(变条件)若增加条件n=100,问能否在犯错误不超过0.1的前提下,可认为“性别与休闲方式有关”? 100[解] 由(2)可知,当n=100时,K2的观测值k=36≈2.78>2.706.故在犯错误不超过0.1的前提下,我们可以认为性别与休闲方式有关.
解决一般的独立性检验问题的步骤
独立性检验问题的求解策略
7
(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.
(2)K2统计量法:通过公式 n?ad-bc?2
k= ?a+b??c+d??a+c??b+d?
先计算观测值k,再与临界值表作比较,最后得出结论.
1.判断正误
(1)在独立性检验中,若K2越大,则两个分类变量有关系的可能性越大.( ) (2)2×2列联表是借助两个分类变量之间频率大小差异说明两个变量之间是否有关联关系.( )
(3)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的.( )
[答案] (1)√ (2)√ (3)×
2.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )
A.100个心脏病患者中至少有99人打鼾 B.1个人患心脏病,则这个人有99%的概率打鼾 C.100个心脏病患者中一定有打鼾的人
D.100个心脏病患者中可能一个打鼾的人都没有
D [这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”,这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.]
3.观察下列各图,其中两个分类变量x,y之间关系最强的是________.
8
④ [在四幅图中图④中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选④.]
4.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
男顾客 女顾客 满意 40 30 不满意 10 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:
2
n?ad-bc?
K2=
?a+b??c+d??a+c??b+d?
40
[解] (1)由调查数据,男顾客中对该商场服务满意的比率为50=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.
30
女顾客中对该商场服务满意的比率为50=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.
100×?40×20-30×10?2
(2)K=≈4.762.
50×50×70×30
2
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
9
课时分层作业(二) 独立性检验的基本思想
及其初步应用
(建议用时:60分钟)
[基础达标练]
一、选择题
1.以下关于独立性检验的说法中,错误的是( ) A.独立性检验依赖于小概率原理 B.独立性检验得到的结论一定准确
C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判断两事物是否相关的唯一方法
B [根据独立性检验的原理可知得到的结论是错误的情况是小概率事件,但并不一定是准确的.]
2.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
秃发 不秃发 心脏病 20 5 无心脏病 300 450 775×?20×450-5×300?2根据表中数据得到k=≈15.968,因为k>6.635,则
25×750×320×455断定秃发与心脏病有关系,那么这种判断出错的可能性为( )
A.0.1 C.0.025
B.0.05 D.0.01
D [∵P(k>6.635)=0.01,故选D.]
3.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差 C.独立性检验
B.回归分析 D.概率
10
19-20 第1章 1.2 独立性检验的基本思想及其初步应用



