第8章 定性资料的比较 案例辨析及参考答案
案例8-1 某单位调查了4类人员乙型肝炎表面抗体(HBsAb)的阳性率,想比较3种病人与健康人群的阳性率有无差别,数据见教材表8-14。
教材表8-14 4类人员乙型肝炎表面抗体(HBsAb)的阳性率 组别 肝癌病人 肝炎病人 食管癌病人 健康人 合计
阳性人数
17 18 5 3 43
阴性人数
159 160 142 151 612
合计 176 178 147 154 655
阳性率/%
9.66 10.11 3.40 1.95 6.56
请大家对本案例讨论如下问题:
(1)若看成一个4×2列联表资料进行1次?检验,是否能达到分析目的? (2)若将每一种病人与健康人群HBsAb的检查结果分别组成四格表,进行3次四格表
2?2检验,对否?
(3)怎样达到分析目的? 案例辨析
(1)因为分析目的是“想比较3种病人与健康人群的阳性率有无差别”,进行1次?检验,不能达到分析目的。
(2)独立地进行3次四格表?检验是不妥的,因为那样做会增大犯假阳性错误的概率。
正确做法
(1)就本例而言,对于这个4组二分类资料,当小于5的理论频数的个数少于总格子数的 1/5 时,适合用一般? 检验进行总的分析。 其结果是 ?= 14.148 9,P=0.002 7<0.05,4类人员HBsAb阳性率之间的差别有统计学意义。
(2)接着作两两比较,原作者较关注3种病人与健康人的HBsAb比较,其阳性率是否有差异,因此只需比较3次。但每次比较,对应的检验水准应作调整(见后)。
(3)为了达到前述的统计分析目的,又使犯假阳性错误的概率不增加,应当对每个四格表资料进行假设检验时降低检验水准,即取???0.05/(2?3)?0.0083。于是,肝癌病人和健康人比较?=8.577 9,P=0.003 4<0.008 3;肝炎病人和健康人比较?= 9.288 3,
222222P= 0.002 3<0.008 3; 食管癌病人和健康人比较?2校正=0.180 7,P=0.670 7>0.008 3。
因此可以认为,肝癌病人、肝炎病人和健康人的HBsAb阳性率有差异,而不能认为食管癌病人和健康人的HBsAb阳性率有差异。(说明:?检验通常为单侧检验,所以,校正的??应等于?/(2?C),这里C为两两比较的总次数)
案例8-2 在论文《果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察》中,为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,将患者随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞磷胆碱。治疗效果分为无效、有效和显效三种结果(教材表8-15)。
教材表8-15 观察组与对照组的疗效比较
组 别 观察组 对照组 合 计
疗效(例数)
显效 58 56 114
22
无效 18 35 53
2有效 44 43 87
合计 120 134 254
原作者采用列联表的专用?检验公式,结果是:?=4.74,P<0.05,认为两组疗效之间的差异有统计学意义。
请大家对本案例讨论如下问题:
(1)原作者的分析目的是什么?选用?检验的问题在哪里? (2)什么情况下可以选用?检验?
(3)本问题应选用的统计分析方法是什么?为什么要选择这样的方法?
案例辨析 分析目的为“比较观察组与对照组治疗新生儿缺氧缺血性脑病的疗效有无差异”;选用?检验不能达到前述的分析目的,因为此检验法与疗效的有序性没有任何联系。
正确做法
(1)如果仅关心两个实验分组中的患者在三个疗效等级上的人数分布是否相同,此时,可以选用?检验。
(2)本例的定性资料属于“结果变量为有序变量的单向有序的2?3列联表资料”,为了实现前述的统计分析目的,应选用秩和检验。本例采用秩和检验进行统计分析,
2222HC?2.8107,P=0.093 6。尚不能得出两组疗效之间的差异有统计学意义的结论。
案例8-3 某研究者欲比较食管癌TNM分期的某种基因蛋白阳性表达率有无差异,收集了食管癌Ⅱa期患者7例、Ⅱb期患者10例、Ⅲ期患者23例,检测了某种基因蛋白的阳性表达例数(X)分别为3、8和21例。研究者考虑食管癌的TNM分期是有序变量,因此运用秩和检验处理资料,结果HC=6.119 1,P=0.013 4(教材表8-16), 差异有统计学意义。
教材表8-16 食管癌TNM分期的阳性表达情况与秩和检验结果
食管癌 TNM分期
Ⅱa Ⅱb Ⅲ
n
7 10 23
X/n
3/7 8/10 21/23
HC
6.119 1
P 0.013 4
请大家对本案例讨论如下问题:
(1)原作者的分析目的是什么?在此目的下应选择的统计分析方法是什么? (2)在什么情况下可以选用秩和检验?
案例辨析 原作者盲目选择秩和检验处理了该资料。原作者的分析目的是“食管癌TNM分期在某种蛋白的阳性表达率方面有无差异”;为实现此分析目的,首先应弄清这是一个什么样的列联表资料。食管癌TNM分期这个有序变量是“原因变量”,不是“结果变量”,结果变量为“是否阳性”,故此定性资料可以被视为“双向无序的3?2列联表资料”。
正确做法 以采用一般?检验或Fisher精确检验(若小于5的理论频数的个数小于总格子数的1/5)处理资料为宜。可将教材表8-16整理成案例表8-1,因为有3个理论频数小于5,故采用Fisher精确概率法进行计算更合适,结果是:P=0.017 2,可以认为食管癌TNM不同分期某种蛋白的阳性表达率之间的差异有统计学意义。
案例表8-1 食管癌TNM分期的某种蛋白阳性表达情况 食管癌 TNM分期
Ⅱa Ⅱb Ⅲ 合 计
阳性例数 3 8 21 32
阴性例数
4 2 2 8
合计 7 10 23 40
2但当结果变量为多值有序变量,且希望比较各期患者在结果上的差别是否具有统计学意义时,需要选用秩和检验。本例,原作者对原因变量“赋值或打分”,采用秩和检验是没有意义的。