好文档 - 专业文书写作范文服务资料分享网站

第5章定性资料的统计描述

天下 分享 时间: 加入收藏 我要投稿 点赞

第五章 定性资料的统计描述

第五章 定性资料的统计描述

在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。如性别、HIV感染情况、病情轻重等都属于分类资料。分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。

第一节 常用相对数及其应用

一、定性资料的频数分布

与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指标进行统计描述和统计推断。定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双向分类形成的表,可用于考察两种属性的关系。表5.1为某中学不同性别青春期少年对自身体型感觉的构成情况的列联表。

表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况

性别 男 女

自感偏瘦 39 25

正常 186 130

自感偏胖 20 54

列联表的横标目一般为分组变量,纵标目为结局变量。列联表的用途主要有: 1. 列出每组中各种不同结局分类后的频数。 2. 描述频数分布的特征。

3. 便于进一步对分类资料的特征进行统计描述和统计推断。

二、 常用相对数指标

除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。

5-1

第五章 定性资料的统计描述

(一)率

率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。

频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。其计算公式可表达为:

频率?同时期实际发生某现象的观察单位数?K (5.1)

某时期可能发生某现象的观察单位总数式中,K为比例基数,可以是100%、1000‰、100000/10万等。比例基数的选择主要根据习惯用法或使计算结果保留1~2位整数,以便阅读。

例5.1 根据2008年某市健康城市调查数据,研究吸烟与慢性阻塞性肺部疾病(COPD)的关系,结果见表5.2。试计算该资料中吸烟者与不吸烟者患COPD的患病率。

表5.2 2008年某市吸烟者与不吸烟者的COPD患病情况

吸烟 不吸烟 合计

患COPD 136 161 297

未患COPD 2635 5409 8044

合计 2771 5570 8341

由式(5.1),吸烟者COPD的患病率=的患病率=

136?100%=4.91%,不吸烟者COPD2771161?100%=2.89%,吸烟者COPD的患病率比不吸烟者COPD的患5570病率高2.02%。

速率(rate)是带有时间因素的频率,是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生频率之意。如肿瘤患者的5年生存率、根据追踪随访资料计算的死亡率、年(月、季)发病率等指标,都包含时间因素,在流行病学中也称为发病密度。速率具有量纲,取值范围是[0,??),其计算公式可表达为:

速率?观察时段内某现象的发生数?K (5.2)

可能发生某现象的观察人时数式中的比例基数K与式(5.1)相同。

5-2

第五章 定性资料的统计描述

例5.2 在一项随访研究中,对125人追踪随访了2年,结果有2人发生了死亡,则由式(5.2)可得,

年死亡率=2?100%=0.8% 125?2(二)构成比

构成比(proportion)即比例,是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,用以说明事物内部各组成部分所占的比重,常用百分数表示。计算公式为:

构成比?某一组成部分的观察单位数?100% (5.3)

同一事物各组成部分的观察单位总数例5.3 某医院2007年院内感染的流行病学调查发现66例感染,感染者的感染部位分布情况如表5.3所示。在该医院的院内感染中,手术创伤感染的构成比为27.27%,在各感染部位中所占比重最大;其次是呼吸道感染,其构成比为24.24%;接下来依次是泌尿道和皮肤感染,其构成比均为16.67%,各感染部位合计构成比为100%。

表5.3 某医院2007年院内感染者的感染部位构成情况 感染部位 手术创伤感染 呼吸道感染 泌尿道感染 皮肤感染 胃肠道感染 其他

合计

感染例数 18 16 11 11 4 6 66

构成比(%) 27.27 24.24 16.67 16.67 6.06 9.09 100.00

构成比具有以下特点:①分子是分母的一部分,各组成部分构成比数值在0~1之间波动,各组成部分的构成比数值之和等于1或100%。②事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数值增大,其他组成部分的构成比数值必然会减少。例如在一定数量的人口性别构成中,若男性比例增加,则女性比例减少。

(三)相对比

相对比简称比(ratio),是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。如前面讲到的变异系数、流行病学中常用的相对危

5-3

第五章 定性资料的统计描述

险度、人口学研究中常用到的性别比等都属于相对比。相对比的分子和分母可以是绝对数,也可以是相对数或平均数,计算公式为:

相对比?甲指标(或?100%) (5.4)

乙指标根据其分子与分母的关系,相对比可分为:①关系指标:指两个有关的非同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。②对比指标:指同类事物的两个指标之比,以达到比较的目的。如2011年我国出生性别比为117.78,说明2011年我国男性出生人数比女性高,男、女性别比有所失衡。又如同时期不同年龄人群的某病发病率之比,以说明不同人群的发病情况。

例5.4 为了解新生儿的锌的营养状况,分别测量某医院足月儿以及早产儿的脐血血清锌含量,结果显示足月儿及早产儿的脐血血清锌含量的均数分别为1.85mg/L和1.41mg/L,则该医院足月儿与早产儿的脐血血清锌含量之比为1.85/1.41=1.31,即该医院足月儿脐血血清锌含量是早产儿的1.31倍。

在流行病学研究中,常用的相对危险度(RR)和比值比(OR)都属于相对比指标。

相对危险度(relative risk, RR) 是指暴露于某种危险因素的观察对象的发病危险度与低暴露或非暴露的观察对象的发病危险度之间的比值。相对危险度常用于流行病学队列研究中,用来度量暴露的危险性大小。其计算可用暴露与低暴露(或非暴露)于危险因素的累积发病率或发病密度(p)估计:

相对危险度(RR)?暴露组发病率(?p1) (5.5) p低暴露(或非暴露)组发病率(?2)例5.5 某锡矿为了解一线作业对工人健康的影响,对1000名新参加工作的工人进行了20年的追踪随访,结果发现从事一线作业的680名工人有5人发生了肺癌,而从事非一线作业的320名工人仅1人发生了肺癌。试估计该锡矿一线作业对肺癌的相对危险度。

一线作业工人肺癌的发病率p1=5/680 =73.53/万;非一线作业工人肺癌的发病率p2=1/320=31.25/万。

一线作业工人发病率(?p1)73.53/万相对危险度(RR)???2.35

非一线作业工人发病率(?p2)31.25/万可见,该锡矿一线作业工人发生肺癌的危险是非一线作业工人的2.35倍。

5-4

第五章 定性资料的统计描述

比值比(odds ratio, OR),又称优势比,是指病例组有无暴露于某危险因素的比值与对照组有无暴露于同一危险因素的比值之比,常用于流行病学病例对照研究中,以度量暴露的危险性。计算公式:

比值比(OR)?病例组暴露的比值a/cad?? (5.6)

对照组暴露的比值b/dbc式中,a为病例组中暴露的人数;b为对照组中暴露的人数;c为病例组中未暴露的人数;d为对照组中未暴露的人数。

例5.6 某中学发生一起因饮水引起的甲型肝炎(甲肝)爆发,经调查发现,该校部分学生有生饮自来水的习惯,34名甲肝患者中有22人生饮自来水;而1449名健康学生中,生饮自来水的有255人,结果见表5.4。试估计该中学甲肝发病与生饮自来水的比值比。

表5.4 甲肝与生饮自来水的病例对照研究结果 暴露或特征 生饮自来水 未生饮自来水

合计

病例组 22(a) 12(c) 34(a+c)

对照组 255(b) 1194(d) 1449(b+d)

合计 277(a+b) 1206(c+d) 1483(n)

比值比(OR)?病例组暴露的比值ad22/12???8.58

对照组暴露的比值bc255/1194结果提示,甲肝患者生饮自来水与未生饮自来水的比值是健康学生的8.58倍。

第二节 应用相对数的注意事项

一、计算相对数应有足够的观察单位数

计算相对数时,应注意观察的单位数不能太小。必须要有足够的观察单位数作为分母,计算的率才是稳定的,即大数原则“相对数应当在大数中计算和运用”。例如临床试验中用某种疗法治疗2例患者,1例有效,则认为有效率是50%;如果2例都有效,则有效率是100%,可见相差1例其有效率波动非常大。因此,当观察单位数少时,建议采用绝对数表示结果,如果必须要用相对数表示,应同时列出率的置信区间。但通常认为,在设计周密、质量控制严格的动物实验中,观察数量相对较少时所得的相对数指标也较为稳定。

5-5

第五章 定性资料的统计描述

二、分析时不能以构成比代替率

构成比说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。在实际应用中,错误地将构成比当成率来应用,常导致一些不合理的推论。例如在对某月交通事故的数据进行分析后发现,在发生交通事故的车辆中,高速行驶的占31%,中速行驶的占56%,低速行驶的占13%。据此认为,中速行驶的车辆最容易发生交通事故,这明显与常识不符。产生此错误的原因是将发生交通事故的车辆的不同速度构成当成不同速度行驶车辆的事故发生率,由于实际生活中以中速行驶的车辆较多,所以中速行驶车辆的事故发生数构成比较大。车辆事故发生率应该是事故发生数与行驶的车辆数之比。

在医学研究中这种情况也常出现,常见的错误是采用门诊患者或住院患者的资料来分析疾病与年龄、性别、职业等的关系,这种资料所计算的相对数指标通常是构成比,不能当作率来分析。例如,某医师根据门诊资料分析慢性支气管炎与年龄的关系,如表5.5所示:

表5.5 门诊慢性支气管炎患者的年龄构成

年龄组(岁)

0~ 20~ 40~ 60~ 合计

患者人数

48 74 87 39 248

患者构成比(%)

19.4 29.8 35.1 15.7 100.0

表中“患者构成比”一栏,仅说明各年龄组患者所占的比重,只能计算构成比指标,不能反映各年龄组的患病水平,不能由40~59岁组构成比最高而得出该年龄组最容易患慢性支气管炎的结论。因为各年龄组的人口数、就诊机会等因素都会影响门诊患者的年龄构成,若要分析慢性支气管炎患病率与年龄的关系,只能通过对一般人群的抽样调查才能了解各年龄组患病率的情况。

在构成比指标中,某一组成部分构成比的增减会影响到其他组成部分构成比的变化。某地2000年和2005年慢性疾病的发病情况如表5.6所示:

表5.6 某地2000年和2005年慢性疾病的发病情况

疾 病

2000年

5-6

2005年

第五章 定性资料的统计描述

病例数

呼吸系统疾病 循环系统疾病 恶性肿瘤 其他 合 计

1685 1433 915 1540 5573

构成比(%) 30.24 25.71 16.42 27.63 100.00

病例数 2577 2671 1711 1964 8923

构成比(%) 28.88 29.93 19.18 22.01 100.00

2005年与2000年相比,呼吸系统疾病的构成比明显下降,而循环系统疾病、恶性肿瘤的构成比均有所上升。如果据此作出呼吸系统疾病发病下降,循环系统疾病、恶性肿瘤发病上升的结论,就犯了以构成比的动态分析代替率的动态分析的错误。因为2005年与2000年相比,各类型慢性疾病发病的人数都在增加,若要反映各类型慢性疾病发病强度的变化,应对2000年和2005年各类型慢性疾病的发病率进行比较。

三、应分别将分子和分母合计求合计率

对分组资料计算合计率时,不能简单地把各组率取平均数,而应分别将分子和分母合计,再求出合计率。例如,某社区为了解儿童龋齿的患病情况,以进一步在社区开展预防儿童龋齿健康教育活动,对该社区的所有幼儿园儿童进行了龋齿的免费检查,结果小班的200名儿童中, 30名有龋齿,患病率为15.0%;中班的180名儿童中, 36名有龋齿,患病率为20.0%;大班的160名儿童中, 40名有龋齿,患病率为25.0%。则该幼儿园的儿童龋齿患病率应该是

30?36?40?100%?19.6%

200?180?160而不是 (15.0%+20.0%+25.0%)/3 =20.0%。

四、相对数的比较应注意其可比性

影响相对数高低的因素较多,在比较相对数时,除了欲对比的因素之外,其余的影响因素应尽可能相同或相近。例如比较各组患者的年龄、性别、病情轻重等构成是否相同,若构成不同,则应考虑进行分层(分年龄、性别、病情轻重)比较,或者对合计率进行标准化后再作比较。例如,两种药物对胃溃疡的治愈率如表5.7所示:

5-7

第五章 定性资料的统计描述

表5.7 两种药物对胃溃疡的治愈率比较

病情 轻型 重型 合计

A药

病人数 80 120 200

治愈数 68 78 146

治愈率(%)

85.0 65.0 73.0

病人数 100 60 160

B药 治愈数 85 39 124

治愈率(%)

85.0 65.0 77.5

如果只比较合计治愈率,似乎B药优于A药,但当分别考察轻型病例和重型病例时,两种药物的治愈率是相同的。其原因在于:两种药物治疗对象的病情构成不同,A药组轻型病例少而重型病例多,B药组却是轻型病例多而重型病例少。因此要正确比较两种药物的治愈率,可按病情轻重分层分析,或通过计算标准化治愈率进行比较。

五、样本率或样本构成比的比较应作假设检验

由于样本率或样本构成比存在抽样误差,如果通过样本推断总体率或总体构成比有无差异,不能凭样本率或样本构成比的差别作结论,而须进行差别的假设检验。

六、某些情况下最好使用绝对数

前面已经讲过分母太小时,最好不用相对数,可用绝对数描述,如果要用,则需要写出该相对数的可信区间。另外,通过绝对数,可以了解一个国家或地区的经济、社会、环境、人文等方面的宏观基本情况,也可以了解部门、组织、单位、人口等微观基本情况。在下列几种情况下不能计算相对数,应该采用绝对数。

1. 传染病疫情描述。历史上记录因鼠疫、天花、黑死病等传染病爆发导致死亡的人数,是古代人们利用绝对数的经典案例。另外,绝对数常用于描述非典(SARS)或者脊髓灰质炎等传染病病例的发生例数。

2. 其他突发事件的描述。在某个地方发生地震、海啸、台风等罕见事件中,要描述人员、家畜等的伤亡情况,对灾区进行支援情况,需要表明事物的规模大小、水平高低的一种统计指标。这时只能用绝对数,不能使用相对数。

第三节 动态数列及其应用

5-8

第五章 定性资料的统计描述

动态数列(dynamic series)是一系列按照时间顺序排列的统计指标(包括绝对数、相对数或平均数),用以反映事物或现象在时间上的变化和发展趋势。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

例5.7 表5.8是2000~2009年中国婴儿死亡率的统计数据,试计算动态数列的分析指标。

表5.8 2000~2009年中国婴儿死亡率发展动态 死亡率 绝对增长量 发展速度 (‰) (3)

32.2 30.0 29.2 25.5 21.5 19.0 17.2 15.3 14.9 13.8

年份 (1)

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

符号 (2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9

增长速度 定基比 (8) -

-0.07 -0.09 -0.21 -0.33 -0.41 -0.47 -0.52 -0.54 -0.57

累计 (4) -

-2.2 -3.0 -6.7 -10.7 -13.2 -15.0 -16.9 -17.3 -18.4

逐年 (5) -

-2.2 -0.8 -3.7 -4.0 -2.5 -1.8 -1.9 -0.4 -1.1

定基比 (6) -

0.93 0.91 0.79 0.67 0.59 0.53 0.48 0.46 0.43

环比 (7) -

0.93 0.97 0.87 0.84 0.88 0.91 0.89 0.97 0.93

环比 (9) -

-0.07 -0.03 -0.13 -0.16 -0.12 -0.09 -0.11 -0.03 -0.07

一、绝对增长量

绝对增长量是指事物现象在一定时期增长的绝对值,可分为两种: (一) 累计增长量

累计增长量(cumulative quantity of increase) 是指报告期的指标值与某一固定期(基期)指标值的差值,其计算公式为:

累计增长量?报告期指标值?某固定期指标值=an?a0 (5.7)

式中,a0为某一固定期(基期)指标值,an为报告期指标值。

本例中,2005年的婴儿死亡率累计增长量?19.0‰?32.2‰??13.2‰,见表5.8第(4)栏。

(二) 逐年增长量

指报告期的指标值与相邻的前期指标值之差,其计算公式为:

逐年增长量?报告期指标值?相邻前期指标值=an?an?1 (5.8)

5-9

第五章 定性资料的统计描述

本例中,2005年较2004年婴儿死亡率的逐年增长量

?19‰.0?‰21?.?25.‰5,见表5.8第(5)栏。

二、发展速度与增长速度

发展速度(speed of development)与增长速度(speed of increase)都是相对比指标,用以说明事物现象在一定时期的速度变化。

发展速度说明报告期指标值水平与某一固定期指标值相比或与相邻的前期指标值相比,是其多少倍。根据其比较对象的不同,分为定基比发展速度和环比发展速度。

定基比发展速度:指报告期的指标值与某一固定期(基期)指标值之比,可表达为a1/a0,a2/a0,…,an/a0。a0为某一固定期(基期)指标值,an为报告期指标值。 本例中,2005年婴儿死亡率的定基比发展速度=19.0/32.2=0.59,2006年婴儿死亡率的定基比发展速度=17.2/32.2=0.53,…,以此类推,见表5.8第(6)栏。

环比发展速度:指报告期指标值与相邻前期指标值之比,可表达为

a1/a0,a2/a1,…,an/an?1。本例中,该地区2005年婴儿死亡率的环比发展速度=19.0/21.5=0.88,2006年婴儿死亡率的环比发展速度=17.2/19.0=0.91,…,以此类推,见表5.8第(7)栏。

增长速度是发展速度的净增长量,增长速度=发展速度-1,以说明报告期指标值与某一固定期指标值相比或与相邻的前期指标值相比,增长了多少倍。本例中,2005年婴儿死亡率的定基比增长速度=0.59?1=?0.41,见表5.8第(8)栏;同年婴儿死亡率的环比增长速度=0.88?1=?0.12,见表5.8第(9)栏。

三、平均发展速度与平均增长速度

平均发展速度(average speed of development)是指一定时期内各环比发展速度的平均值,用以说明事物现象在一定时期内逐年的平均发展程度,常用几何平均数来计算平均发展速度。计算公式为:

平均发展速度=nan/a0 (5.9)

平均增长速度(average speed of increase )是说明某事物在一定时期内逐年的平均增长程度。计算公式为:

5-10

第五章 定性资料的统计描述

平均增长速度=平均发展速度-1 (5.10)

根据表5.8的资料,2000年婴儿死亡率为32.2‰,到2009年减少到13.8‰,相当于2000年的0.43倍。2000~2009年的平均发展速度为913.8/32.2?0.91倍,平均增长速度=0.91?1=?0.09倍,婴儿死亡率总体呈负增长趋势。从环比增长速度看,2004年降低速度较快,减少了0.16倍。

动态数列不仅可以分析过去一段时间的变化规律,也可根据其过去的变化规律预测未来发生情况,计算未来几年后指标所达到的水平。如根据表5.8资料,可预测到2015年中国婴儿死亡率规模,相当于按式(5.9)计算a15:

0.91?15a15/32.2‰ a15?0.9115?32.2‰?7.8‰

即根据中国2000~2009年婴儿死亡率的平均发展速度,预计到2015年中国婴儿死亡率将降低到7.8‰。

第四节 率的标准化

一、标准化法的意义

在本章第二节中曾提到,当所比较的各组观察对象内部构成不同时,应考虑

进行分层比较,或者对合计率进行标准化后再作比较。

以表5.7资料为例,要比较两种药物治疗胃溃疡的治愈率,如果仅比较合计的治愈率,A药的合计治愈率是73.0%,而B药的合计治愈率是77.5%,显然B药比A药的治愈率高。但当我们分别考察普通型病例和重型病例两组人群时,两种药物的治愈率是相同的。那么,为什么合计的治愈率B药比A药高呢?其原因就是:两种药物治疗对象的病情构成不同,B药组轻型病例多而重型病例少,A药组却是轻型病例少而重型病例多。要消除这种假象,可以采用率的标准化法计算标准化率后再进行比较。

标准化法(standardization)的基本思想就是采用统一的标准构成,以消除年龄、性别、病情轻重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率(standardized rate)具有可比性。标准化法的思想也可用于平均数的比较,如比较两个医院平均住院天数,需考虑不同科室住院患者的构成对平均住院天数的影响。总之,标准化的目的在于消除年龄、性别、病情轻重

5-11

第五章 定性资料的统计描述

等混杂因素对研究结果的影响。在医学研究中,混杂因素(confounding factor)通常指与研究因素有关并对研究结果产生影响的非研究因素。在资料分析阶段有许多控制混杂因素的方法,标准化法是其中之一。

二、标准化率的计算

计算标准化率的常用方法有直接法和间接法两种。以表5.9为例说明两组观察对象的年龄构成不同时,其标准化死亡率的计算方法和计算公式。其它标准化率的计算与之类似。

表5.9 计算标准化率的数据符号

标准组

死亡数 死亡率 人口数

被标化组 死亡数

死亡率

年龄组 1 2 ┇

人口数

N1 N2

R1 R2

P1 P2

n1 n2

r1 r2

p1 p2

k

合计

Nk

N

Rk Pk nk rk pk

p

R P

n

r

(一) 直接法

当已知被标化组的年龄别死亡率pi时,宜采用直接法计算标准化率,这里又分两种情况:

1. 已知标准组年龄别人口数时,

p???Nipi (5.11) N式中,p?为标准化率;Nipi为各年龄组的预期死亡数,是指用被标化组的年龄别死亡率pi去预测在标准人口Ni中,可能会有多少人发生死亡。总的预期死亡数?Nipi除以标准组总人口数N就得到标准化率。

2. 已知标准组年龄别人口构成比时,

p???(式中,标准组的年龄构成比

Ni)pi (5.12) NNi乘以被标化组的年龄别死亡率pi称为分配死亡率,N 5-12

第五章 定性资料的统计描述

分配死亡率的累计?(Ni)pi就是标准化率。 N如果采用相同的标准组,式(5.11)和式(5.12)计算的结果是完全一致的。 (二) 间接法

当被标化组的年龄别死亡率pi未知,只有年龄别人口数ni和死亡总数r时,可采用间接法。间接法必须有标准组的年龄别死亡率Pi,计算公式为:

p??P?r (5.13) ?niPi式中,P为标准组的合计死亡率,?niPi是被标化组的预期死亡人数,

r是?niPi被标化组的实际死亡数与预期死亡数之比,称为标准化死亡率比(standardized mortality ratio, SMR)。

若SMR?1,表示被标化组的死亡数高于标准组;若SMR?1,表示被标化组死亡数低于标准组。用标准化死亡比(SMR)乘以标准组的合计死亡率P,即得到间接法标准化死亡率p?。

(三) 标准化率的计算步骤

1.根据被标化组的数据条件选择直接法或间接法 如对死亡率的年龄构成标准化,如果已知被标化组的年龄别死亡率,宜采用直接法计算标准化率;如果没有被标化组的年龄别死亡率,只有年龄别人口数和死亡总数,应采用间接法计算标准化率。

2.选择标准组 ①根据研究目的选择有代表性的、较稳定的、数量较大的人群,例如全国的、全省的或本地区的数据;②也可将欲比较的两地或两组的人口数合并作为标准组,或选择其中一组人口作为标准。

3.选择公式计算标准化率 根据所选方法和数据条件选择相应的公式。 下面以表5.7为例,对治愈率进行标准化,说明直接法计算标准化率的具体过程。计算结果见表5.10。

(1) 已知A、B两药分别治疗轻型病例和重型病例的治愈率,可采用直接法计算标准化治愈率。

(2) 选择两组的合并治疗例数作为标准人口数Ni,见表5.10第(2)栏。 (3) 按式(5.11)计算新疗法组和一般疗法组的标准化治愈率。

5-13

第五章 定性资料的统计描述

表5.10 直接法计算两种疗法的标准化治愈率(%)

病情 (1) 轻型 重型 合 计

标准人口数

治愈率

'

A药

B药

Ni

p1i预期治愈数

'

Nip1i153 117

治愈率

'

p2i预期治愈数

'

Nip2i153 117

(2) (3) 85.0 65.0 73.0

(4)=(2) (3)

(5) 85.0 65.0 77.5

(6)=(2) (5)

180 180 360(∑Ni)

270(∑Nip1i)

270(∑Nip2i)

A药的标准化治愈率p1'? B药的标准化治愈率p2'?270?100%?75.0% 360270?100%?75.0% 360 可见,经标准化以后,A、B两药的治愈率是相同的,与分病情比较的结果一致。标准化法解决了由于患者病情构成不同而导致的合计治愈率与分病情比较相矛盾的问题。

本例也可用式(5.12)计算标准化治愈率,结果与式(5.11)完全一致,见表5.11。

表5.11 利用标准患者病情构成比计算两种疗法的标准化治愈率(%)

A药 B药 标准患者

病 情

(1) 轻型 重型 合 计

病情构成比

Ni/N

(2) 0.5 0.5 1.0

原治愈率

'

p1i '

(Ni/N)p1i (4)=(2) (3) 42.5 32.5 75.0(p1)

'分配治愈率

原治愈率

'

分配治愈率

p2i(Ni/N)p2i(6)=(2) (5) 42.5 32.5 75. 0(p2)

''

(3) 85.0 65.0 73.0

(5)

85.0 65.0 77.5

下面举例说明间接法计算标准化率的具体过程。

例5.8 已知某地2010年恶性肿瘤死亡总数46人,该地2010年各年龄组的平均人口数见表5.12第(3)栏。试问该地恶性肿瘤死亡率是否高于全国平均水平?

(1) 由于知道该地恶性肿瘤死亡总数r和各年龄组人口数ni,未知该地各年

5-14

第五章 定性资料的统计描述

龄组恶性肿瘤死亡率pi,故选用间接法计算标准化死亡率。

(2) 选择全国同期各年龄组恶性肿瘤死亡率Pi作为标准,见表5.13第(2)栏。 (3) 按式(5.13)计算该地的恶性肿瘤标准化死亡率。

表5.12 间接法计算某地2010年恶性肿瘤标准化死亡率(1/10万)

某 地

年龄组 标准死亡率

人口数 预期死亡数

nPi i i niPi

(1) (2) (3) (4)=(2) (3) 0~ 5.71 4085 0.233 20~ 40~ 60~ 合 计

28.45 156.31 358.67 64.92

3718 2381 2846 13030

1.058 3.722 10.208 15.221( ?nP)iP该地2010年恶性肿瘤的标准化死亡比 SMR?46?3.022 15.221标准化死亡率p'?64.92/10万?3.022?196.20/10万

注意:在本例中,标准化死亡比和标准化率的计算都是以同期全国平均水平作参照计算的。该地恶性肿瘤的标化死亡比为3.022,说明该地恶性肿瘤的死亡水平是全国平均水平的3.022倍。通过计算标准化死亡率p?为196.20/10万。

(三) 应用标准化法的注意事项

1. 标准化法的目的是为了消除混杂因素的影响,通过选择同一参照标准,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此标准化率仅适用于相互间的比较,实际水平应采用未标化率来反映。

2. 样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否不同,需作假设检验。

3. 注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。该法计算简便,易于理解,较为常用。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。

4. 各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不

5-15

第五章 定性资料的统计描述

同引起的不可比性问题,标准化法难以解决。

小 结

1. 定性资料常用率、构成比、相对比等相对数指标进行描述。应根据研究目的选用相应的指标。使用相对数时要注意杜绝一些常见的错误。

2. 动态数列是一系列按照时间顺序排列起来的统计指标,用以反映事物或现象在时间上的变化和发展趋势。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

3. 在对合计率进行比较时,如果各组观察对象内部构成不同,应考虑对合计率(平均率)进行标准化。标准化法就是采用统一的标准构成,消除因混杂因素构成不同对总指标的影响。计算标准化率的常用方法有直接法和间接法两种。如果已知被标化组的年龄别死亡率,宜采用直接法计算标准化率;如果没有被标化组的年龄别死亡率,只有年龄别人口数和死亡总数,可采用间接法计算标准化率。

本章需掌握的核心要点和内容

1. 定性资料常用描述指标:率、构成比、相对比等相对数。

2. 应用相对数应注意的问题:计算相对数分母不能太小;计算平均率如果分母不相等则需要用分子之和除以分母之和;两个率的比较要注意可比性;样本率或样本构成比的比较应作假设检验;某些情况下只能使用绝对数。

3. 常用的动态数列分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

4. 标准化法:标准化法的基本思想及意义;直接和间接标准化法的应用;标化死亡比的含义。

(贾红)

5-16

第5章定性资料的统计描述

第五章定性资料的统计描述第五章定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。如性别、HIV感染情况、病情轻重等都属于分类资料。分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。例如甲医院某年因某病死亡105人,同年乙医院因该病死亡18
推荐度:
点击下载文档文档为doc格式
98otd0s0f17l7tx29ybm0wacw0f2p400g7m
领取福利

微信扫码领取福利

微信扫码分享