第八章 ?2检验
一、教学大纲要求
(一) 掌握内容 1. ?2检验的用途。 2. 四格表的?2检验。
(1) 四格表?2检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的?2检验。 3. 行?列表的?2检验。 (二) 熟悉内容
频数分布拟合优度的?2检验。 (三) 了解内容 1.?分布的图形。
2.四格表的确切概率法。
2二、教学内容精要
(一)
?2检验的用途
?2检验(Chi-square test)用途较广,主要用途如下:
1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)
?2检验的基本思想
2222?1??2)1.?检验的基本思想是以?值的大小来反映理论频数与实际频数的吻合程度。在零假设H0(比如H0:
成立的条件下,实际频数与理论频数相差不应该很大,即?值不应该很大,若实际计算出的?值较大,超过了设定的
检验水准所对应的界值,则有理由怀疑H0的真实性,从而拒绝H0,接受H1(比如H1:?1??2)。 ,A为实际频数(Actual Frequency),T为理论频数(Theoretical Frequency)。四格
T22表?检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的?值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误
样本率与总体率之间存在抽样误差,其度量方法: 2. 基本公式:??2??A?T?2?p?Sp??(1??)n,?为总体率,或 (8-1)
p(1?p), p为样本率; (8-2) n2.总体率的可信区间
当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布。 总体率的可信区间:(p?u?/2?Sp,p?u?/2?Sp)。 (8-3) (四)?检验的基本计算
表8-1
资料形式 四格表
2?2检验的用途、假设的设立及基本计算公式
H0、H1的设立与计算公式 H0:两总体率相等 H1:两总体率不等
①专用公式
用途 ①独立资料两
样本率的比较
②配对资料两 样本率的比较
自由度 1 (ad?bc)2n ??(a?b)(c?d)(a?c)(b?d)2
②当n?40但1?T<5时,校正公式
?2?(ad?bc?n/2)2n(a?b)(c?d)(a?c)(b?d)2
③配对设计?R?C表
①多个样本率、 构成比的比较
②两个变量之 间关联性分析
?(b?c?1)2b?c
(R-1)(C-1)
H0:多个总体率(构成比)相等
(H0:两种属性间存在关联)
H1:多个总体率(构成比)不全相等
(H0:两种属性间存在关联)
?2?n(频数分布表 频数分布的拟合优
度检验
?A2?1) nRnCH0:资料服从某已知的理论分布 H1:资料不服从某已知的理论分布
(A?T)2 ?T据频数表
的组数而定
(五)四格表的确切概率法:当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。 (六)?检验的应用条件及注意事项
1.分析四格表资料时,应注意连续性校正的问题,当1
2.对于R?C表资料应注意以下两点:
(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;
(2)注意考察是否有有序变量存在。对于单向有序R?C表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R?C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R?C表资料,为考察两种方法检测的一致性,应选用Kappa检验。
22三、典型试题分析
(一)单项选择题
1.下列哪项检验不适用?检验( )
A. 两样本均数的比较 B. 两样本率的比较
C. 多个样本构成比的比较 D. 拟合优度检验
答案:A[评析] 本题考点:?检验的主要用途。?检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher精确概率法( )
A.1
答案: C[评析] 本题考点:对于四格表,当T?1或n?40时,不宜用?2检验,应用Fisher精确概率法。 3.?值的取值范围为
A.??? B.0????? C.??1 D.?????0
答案: B[评析]根据?分布的图形或?的基本公式可以判断?值一定是大于等于零且没有上界的,故应选B。
(二)是非题
两样本率的比较可以采用?检验,也可以采用双侧u检验。答案:正确。 [评析]就两个样本率的比较而言,双侧u检验与?检验是等价的。 (三)简答题
1.四格表的?检验和u检验有何联系与区别?
答案:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用?检验,两者是等价的,即u??;相异点:(1)u检验可进行单侧检验;(2)满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)?检验可用于2?2列联表资料有无关联的检验。
2222222222222222222.R?C表?2检验的适用条件及当条件不满足时可以考虑的处理方法是什么?
答案:R?C表?2检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。
(四)计算题
1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。
表8-2 122对同胞兄弟静脉曲张发生情况 肥胖 发生 未发生 19 5 12 86 31 91 正常体重 发 生
未发生 合 计 合计 24 98 122 [评析]这是一个配对设计的资料,因此用配对?2检验公式计算。 H0:肥胖者与正常体重者的静脉曲张发生情况无差别 H1:肥胖者与正常体重者的静脉曲张发生情况不同 ??0.05 ?2?(b?c?1)2b?c=
?5?12?1?25?12?2.12,??1
2?2=2.110.05,1,P>0.05,尚不能认为静脉曲张与肥胖有关。
2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。对三种措施的疗效作出评价。
表8-3 三种措施的近期有效率比较
有效人数 无效人数 合计
51 84 135 6 26 32 5 13 18 62 123 185
矫治方法
夏天无眼药水 新医疗法 眼保健操 合计 有效率(%)
37.78 18.75 27.78 33.51
[评析]
H0:三种措施有效率相等
H1:三种措施有效率不相等或不全相等 ??0.05
22222?512?A284626513(3-1)=2 ??????1?=4.498,?=(2-1)??n(??1)=185????62?135123?13562?32123?3262?18123?18nrnc??查表得0.25>P>0.10,按??0.05水准不拒绝H0,尚不能认为三种措施有效率有差别。
23.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?
表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%)
100 41 颈麻
100 94 注药
100 89 置栓
100 27 对照
[评析] 为了应用?检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。
表8-5 4种镇痛方法的效果比较 镇痛方法 有效例数 无效例数 合计
2颈麻 注药 置栓 对照 合计 H0:4种镇痛方法的效果相同 H1:4种镇痛方法的效果不全相同
41 94 89 27 251 59 6 11 73 149 100 100 100 100 400 ??0.05
?412?A2592732???...??1?=146.175, ??n(??1)=400??149?100?nrnc?251?100149?100?2(2-1)=3 ?=(4-1)
查表得P <0.05,按??0.05水准拒绝H0,接受H1,即4种镇痛方法的效果不全相同。
四、习 题
(一) 单项选择题
1. 关于样本率p的分布正确的说法是: A. 服从正态分布 B. 服从?分布
C. 当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布 D. 服从t分布 2. 以下说法正确的是: A. 两样本率比较可用u检验 B. 两样本率比较可用t检验
2?2
D. 两样本率比较时,有t2??2
C. 两样本率比较时,有u?3. 率的标准误的计算公式是: A.
p(1?p) B.
pp(1?p) C. D.
n?1np(1?p) n4. 以下关于?2检验的自由度的说法,正确的是: A.拟合优度检验时,??n?2(n为观察频数的个数) B.对一个3?4表进行检验时,??11 C.对四格表检验时,?=4
22D.若?0.05,???0.05,?,则???
5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?
A.不能确定 B.甲、乙法一样 C.甲法优于乙法 D.乙法优于甲法
6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是: A.分性别比较 B.两个率比较的?2检验 C.不具可比性,不能比较 D.对性别进行标准化后再做比较 7.以下说法正确的是
A.两个样本率的比较可用u检验也可用?2检验 B.两个样本均数的比较可用u检验也可用?2检验 C.对于多个率或构成比的比较,u检验可以替代?2检验 D.对于两个样本率的比较,?2检验比u检验可靠 (二) 名词解释
1. 实际频数与理论频数
2. ?2界值表 3. 拟合优度 4. 配对四格表
5. 双向有序分类资料 6. 率的标准误
7. 多个率的两两比较 8. Fisher精确概率 9. McNemar检验 10. Yates校正 (三) 是非题
2四个样本率做比较,?2??0.05(3) ,可认为各总体率均不相等。 (四) 计算题
1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?
2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?
表8-6 冠心病诊断结果与眼底动脉硬化级别的关系
眼底动脉硬化级别 冠心病诊断结果
正常 可疑 冠心病 0 340 11 6 I 73 13 6 II 97 18 18 III 3 2 1
513 44 31 合计
合计 357
92 133 6 588
3.表8-7是用两种方法检查已确诊的乳腺癌患者120名的检查结果,问:两种方法何者为优?
表8-7 两种方法检查结果比较
甲法 + - 42 18 30 30 72 48 乙法 + - 合计
合计 60 60 120 4.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?
表8-8 两种方法检查结果比较 粪见检阴性人数 阴转率(%)
25 86.2 17 60.7 42 73.7
组 别
试验组 对照组 合 计 观察人数 29 28 57
5.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9,问三个疗程组的有效率之间有无显著差异?
表8-9 冠心2号方治疗心绞痛的有效率 例数 有效例数 有效率(%) 110 82 74.5 150 130 86.7 63 56 88.9 323 268 83.0
疗 程 一疗程 二疗程 三疗程 合 计