好文档 - 专业文书写作范文服务资料分享网站

Stata基本操作和数据分析入门:第五讲 多组平均水平的比较

天下 分享 时间: 加入收藏 我要投稿 点赞

Stata软件基本操作和数据分析入门

第五讲 多组平均水平的比较

赵耐青

一、复习和补充两组比较的统计检验

1. 配对设计资料(又称为Dependent Samples)

a)对于小样本的情况下,如果配对的差值资料服从正态分布,用配对t检验(ttest 差值变量=0)

b)大样本的情况下,可以用配对t检验 c)小样本的情况下,并且配对差值呈偏态分布,则用配对符号秩检验(signrank 差值变量=0)

2. 成组设计(Two Independent Samples)

a)如果方差齐性并且大样本情况下,可以用成组t检验(ttest 效应指标变量,by(分组变量))

b)如果方差齐性并且两组资料分别呈正态分布,可以用成组t检验

c)如果方差不齐,或者小样本情况下偏态分布,则用秩和检验(Ranksum test)

group 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 x 79 93 91 92 94 77 93 74 91 101 83 73 88 102 90 100 81 91 83 106 84 78 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 87 95 101 101 100 114 86 106 107 107 94 89 104 98 110 89 103 89 121 94 95 92 109 98 98 120 104 110

二、多组比较

1. 完全随机分组设计(要求各组资料之间相互独立)

a)方差齐性并且独立以及每一组资料都服从正态分布(小样本时要求),则采用完全随机设计的方差分析方法(即:单因素方差分析,One Way ANOVA)进行分析。

b)方差不齐或小样本情况下资料偏态,则用Kruskal Wallis 检验(H检验)

例5.1 为研究胃癌与胃粘膜细胞中DNA含量(A.U)的关系,某医师测得数据如下,试问四组人群的胃粘膜细胞中平均DNA含量是否相同?

DNA含量(A.U) group

浅表型胃炎 1 9.81 12.73 12.29 12.53 12.95 9.53 12.6 8.9 12.27 14.26 10.68 肠化生 17.54 15.1 17 13.39 15.32 13.74 18.24 13.81 12.63 14.53 16.17 2 14.61 早期胃癌 17.85 21.91 22.13 22.04 19.53 18.41 21.48 20.24 3 23.26 20.8 20.6 23.5 组别

晚期胃癌 19.46 22.39 19.53 25.9 20.43 20.71 20.05 23.41 21.34 21.38 25.70 4 23.73

由于这四组对象的资料是相互独立的,因此属于完全随机分组类型的。检验问题是考察四组

DNA含量的平均水平相同吗。如果每一组资料都正态分布并且方差齐性可以用One way-ANOVA进行分析,反之用Kruskal Wallis检验。 STATA数据输入格式

g 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 x 9.81 12.73 12.29 12.53 12.95 9.53 12.6 8.9 12.27 14.26 10.68 14.61 17.54 15.1 17 13.39 15.32 13.74 18.24 13.81 12.63 14.53 16.17 23.26 20.8 20.6 23.5 17.85 21.91 22.13 22.04 19.53 18.41 21.48 20.24 23.73 19.46 22.39 4 4 4 4 4 4 4 4 4 分组正态性检验,?=0.05

19.53 25.9 20.43 20.71 20.05 23.41 21.34 21.38 25.7 . sktest x if g==1 Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- x | 0.491 0.485 1.07 0.5861 . sktest x if g==2 Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- x | 0.482 0.541 0.96 0.6201 . sktest x if g==3 Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- x | 0.527 0.750 0.52 0.7704 . sktest x if g==4 Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------- x | 0.260 0.616 1.75 0.4166 上述结果表明每一组资料都服从正态分布。 单因素方差分析的STATA命令:oneway 效应指标变量 分组变量,t b 其中t表示计算每一组均数和标准差,b表示采用Bonferroni统计方法进行两

两比较。

本例命令为oneway x group,t b

. oneway x g,t b

| Summary of x

g | Mean Std. Dev. Freq. ------------+------------------------------------ 1 | 11.686364 1.6884388 11 2 | 15.173333 1.749173 12 3 | 20.979167 1.7668279 12 4 | 22.0025 2.2429087 12 ------------+------------------------------------ Total | 17.583191 4.6080789 47

Analysis of Variance

Source SS df MS F Prob > F ------------------------------------------------------------------------ Between groups 824.942549 3 274.98085 77.87 0.0000 Within groups 151.839445 43 3.53114987

------------------------------------------------------------------------ Total 976.781994 46 21.2343912

Bartlett's test for equal variances: chi2(3) = 1.1354 Prob>chi2 = 0.769 方差齐性的检验为:卡方=1.1354,自由度=3,P值=0.769,因此可以认为方差是齐性的。 H0:?1=?2=?3=?4 四组总体均数相同 H1:?1,?2,?3,?4不全相同

?=0.05,相应的统计量F=77.87以及相应的自由度为3和43,P值<0.0001,因此4组均数的差别有统计学意义。

Comparison of x by g (Bonferroni) Row Mean-|

Col Mean | 1 2 3 ---------+---------------------------------

2 | 3.48697(第2组样本均数-第1组样本均数) | 0.000(H0:?1=?2检验的P值) |

3 | 9.2928 5.80583(第3组样本均数-第2组样本均数) | 0.000 0.000(H0:?3=?2检验的P值) |

4 | 10.3161 6.82917 1.02333(第4组样本均数-第3组样本均数) | 0.000 0.000 1.000(H0:?3=?4检验的P值)\\

上述输出为两两比较的结果,在表格的每个单元中,第一行为两组均数的差值,第二行为两组均数比较检验的P值。

根据上述结果可以知道,第2组、第3组和第4组的AU均数均大于第1组的AU均数,并且差别有统计学意义。说明肠化生患者和胃癌患者的DNA的AU含量平均水平均高于正常人的AU平均水平,并且差别有统计学意义。

第3组和第4组的AU均数也大于第2组的AU平均水平,并且差别有统计学意义。说明胃

Stata基本操作和数据分析入门:第五讲 多组平均水平的比较

Stata软件基本操作和数据分析入门第五讲多组平均水平的比较赵耐青一、复习和补充两组比较的统计检验1.配对设计资料(又称为DependentSamples)a)对于小样本的情况下,如果配对的差值资料服从正态分布,用配对t检验(ttest差值变量=0)b)大样本的情况下,
推荐度:
点击下载文档文档为doc格式
1xi1f9flhd8xzko02xoc4ddq3430ci00y89
领取福利

微信扫码领取福利

微信扫码分享