好文档 - 专业文书写作范文服务资料分享网站

第八章随访资料的生存分析

天下 分享 时间: 加入收藏 我要投稿 点赞

第十五章 生存分析

?(t)?P(T?t)?tk时刻仍存活的例数 Skk观察总例数 (15.4)

式中T为观察对象的存活时间。但如果含有截尾数据,分母就必须分时段校正,故上式一般不能直接使用,大多采用概率乘法原理估计生存率。

L,pk,假定观察对象在各个时段的生存事件独立,生存概率分别为p1,p2,则根据概率乘法原理得到生存率的估计公式为:

?(t)?P(T?t)?ppLp (15.5) Skk12k?(t)实质上是累积生存概率(cumulative probability of 从式(15.5)可知,Sksurvival)。例如,3年生存率等于第一年、第二年和第三年生存概率的连乘积,是第一年存活,第二年也存活,第三年仍然存活的累积结果。但习惯上仍根据式(15.4)的定义称之为生存率。

(2) 生存曲线(survival curve):是指将各个时点的生存率在坐标轴上连接在一起的曲线图,用以描述生存过程。

5. 中位生存时间(median survival time) 又称半数生存期,是指生存率为0.5时对应的生存时间,表示有50%的观察对象可活这么长时间。一般采用内插法进行估计。

第三节 未分组资料的生存分析

未分组资料是指由每个观察单位的原始测得值组成的资料,在生存分析中即为各观察单位的具体生存时间资料,对该类资料常用乘积极限法(product-limit estimate)进行分析。乘积极限法是一种非参数方法,由Kaplan-Meier于1958年首先提出,故又称Kaplan-Meier法(简记为KM法)。下面结合实例说明该方法的应用。

例15.1 某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%置信区间、中位生存时间,并绘制生存曲线。

表15.2 乘积极限法估计生存率及其标准误计算表

序号 k

生存时间 死亡数 期初病例数 死亡概率 生存概率

tk

dk

nk

生存率

标准误 ?? SE??S(tk)?qk

15-6

pk

?(t) Sk

第十五章 生存分析

(1) 1 2 3 4 5 6 7 8 9 10 11 12

38+

(2) 1 2 4 5 7 8+ 11 15 18 33+ 36

(3) 1 1 1 1 1 0 1 1 1 0 1 0

(4) 12 11 10 9 8 7 6 5 4 3 2 1

(5) 1/12 1/11 1/10 1/9 1/8 0/7 1/6 1/5 1/4 0/3 1/2 0/1

(6) 1-1/12 1-1/11 1-1/10 1-1/9 1-1/8 1-0/7 1-1/6 1-1/5 1-1/4 1-0/3 1-1/2 1-0/1

(7) 0.9167 0.8333 0.7500 0.6667 0.5833 0.5833 0.4861 0.3889 0.2917 0.2917 0.1458 0.1458

(8) 0.0798 0.1076 0.1250 0.1361 0.1423 0.1423 0.1481 0.1470 0.1387 0.1387 0.1243 0.1243

1. 生存率及其标准误的计算 本例生存时间以月为单位,并将t月当作一个时点看待。现对表15.2中各栏的含义解释如下:

第(1)栏为序号:本例k =1, 2, 3, …, 12。

第(2)栏是将生存时间t由小到大依次排列,如某时间点既有完全数据又有截尾数据,将截尾数据排在后面。

第(3)栏为t月的死亡人数dk,如生存时间t为5个月时有1例死亡,相应的

d4=1。截尾患者即便是已死亡,也非死于处理措施(手术疗法),所以相应的d=0,

如生存时间t为8月时有1例截尾,相应的d6=0。

第(4)栏为期初病例数nk,即恰好在t时点以前尚存活的病例数,如t为5月时对应的n4=9,表示恰好在5月时点前有9人存活。

第(5)栏计算各时点死亡概率qk,即在t时点以前尚存活的患者恰好在t时点上(第t个月)死亡的概率,其计算公式为qk?dk/nk。如q4表示在5月时点前尚存活的9例患者恰好在5月时点上(实指治疗后第5个月的第1天到月末)的死亡概率为q4?1/9。

第(6)栏计算各时点生存概率pk,即在t时点以前尚存活的患者在t时点上(第t个月)继续存活的概率,其计算公式为pk?1?qk?1?dk/nk。如t为5月时对应

15-7

第十五章 生存分析

的p4?1?q4?1?d4/n4?1?1/9。

?(t),第(7)栏计算各时点生存率S即在t时点以前尚存活的患者活过t时点的k概率,按式(15.5)计算。如生存时间t为4月的生存率为:

?(t)?p?p?p?(1?1)(1?1)(1?1)?0.7500 S3123121110第(8)栏为各时点生存率的标准误,其计算公式为:

?(t)]?S?(t)SE[Skk?n(nj?1jkdjj (15.6)

?dj)?(t)的标准误SE[S?(t)]为: 如S33?(t)]?0.7500SE[S3111???0.1250

12(12?1)11(11?1)10(10?1)2. 估计各时点总体生存率的95%置信区间 求出各时点样本生存率及其标准误后,可用正态近似原理估计某时点总体生存率的置信区间,公式为:

?(t)?uSE[S?(t)] (15.7) Sk?2k如本例4月总体生存率的95%置信区间为:

?(t)?1.96SE[S?(t)]?0.7500?1.96?0.1250?0.5050 下限 S33?(t)?1.96SE[S?(t)]?0.7500?1.96?0.1250?0.9950 上限 S33即手术治疗后宫颈癌患者4月生存率的95%置信区间为50.50%~99.50%。 注意:对生存曲线右端尾部的生存率不宜用该法估计其总体生存率的置信区间,因为生存曲线右端尾部的期初观察人数较少,用该法估计总体生存率的置信区间误差较大,可能会出现一些不合理的现象。

3. 中位生存时间的计算 由表15.2可见,中位生存时间估计在7~11月之间,采用内插法计算如下:

(7?11):(7?t)?(0.5833?0.4861):(0.5833?0.5)

t?7?(7?11)(0.5833?0.5)?10.4

0.5833?0.4861即采用手术治疗后宫颈癌患者的中位生存时间为10.4个月。

4. 生存曲线 未分组资料的生存曲线也称Kaplan-Meier曲线。它是以生存

?(t)为纵轴,绘制而成的连续型的阶梯形曲线,用以说明时间t为横轴,生存率Sk

15-8

第十五章 生存分析

生存率与生存时间之间的关系。生存曲线中水平横线的长短代表一个t时点到下一个t时点的距离,当最后一个时点的观察对象全部死亡时,曲线与横轴相交。生存曲线图可直观地比较各组观察对象的生存过程,也可对任意时刻的生存率作出粗略估计。例15.1的生存曲线如图15.1。

1.00.8生存率 0.60.40.20.0010203040

生存时间(月) 图15.1 12例宫颈癌患者的生存曲线(Kaplan-Meier曲线)

第四节 分组资料的生存分析

实际工作中,许多研究的随访是每年1次或每月1次,随访结果只有某年或某月的观察人数、发生死亡事件人数和截尾人数,而没有每个观察对象确切的生存时间,即只能获得按随访时间分组的资料。另外,当样本含量较大(如n?50)时,采用乘积极限法估计生存率及标准误较为繁琐,往往是先将原始资料按照生存时间分组后再进行分析。这种分组资料的生存分析常采用寿命表法(life-table method)。实际上,寿命表法的提出早于乘积极限法,可看作乘积极限法的一种近似。下面结合实例说明该方法的应用。

例15.2 某医师对110例原发性肺癌患者确诊后进行随访,得资料见表15.3第(2)栏~第(4)栏,试估计各时点生存率及其标准误、各时点总体生存率的95%置信区间、中位生存时间,并绘制生存曲线。

表15.3 寿命表法估计生存率及其标准误计算表

15-9

第十五章 生存分析

序号 k (1) 2 3 4 5 6 7 8 9 10

确诊后月数 tk (2) 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~ 9~10

期内截期内死尾人数 亡人数 Ck Dk (3) 1 2 1 2 0 1 0 2 0 1

(4) 25 21 30 18 2 1 2 0 1 0

期初观察人数 Lk (5) 110 84 61 30 10 8 6 4 2 1

校正 人数 Nk (6)

死亡 概率 qk (7)

生存 概率 pk (8) 0.7717 0.7470 0.5041 0.3793 0.8000 0.8667 0.6667 1.0000 0.5000 1.0000

生存率 标准误

?(t) Sk(9) 0.7717 0.5765 0.2906 0.1102 0.0882 0.0764 0.0510 0.0510 0.0255 0.0255

?(t)]SE[Sk(10) 0.0401 0.0475 0.0441 0.0311 0.0285 0.0270 0.0233 0.0233 0.0215 0.0215

1 0~ 109.5 0.2283 83.0 0.2530 60.5 0.4959 29.0 0.6207 10.0 0.2000 7.5 0.1333 6.0 0.3333 3.0 0.0000 2.0 0.5000 0.5 0.0000

1. 生存率及其标准误的计算 本例生存时间以月为单位,现对表15.3中各栏的含义解释如下:

第(1)栏为序号:本例k =1,2,3,…,10。

第(2)栏为确诊后月数tk。“0~”表示从确诊日起不满1月,“1~”表示确诊后满1月但未满2月,其他依此类推。

第(3)栏为期内截尾人数Ck,表示确诊后满t月但未满t+1月期间截尾的人数。如C3=1,表示确诊后满2月但未满3月期间有1例截尾。

第(4)栏为期内死亡人数Dk,表示确诊后满t月但未满t+1月期间发生死亡事件的人数。如D1=25,表示确诊后未满1月有25例死于原发性肺癌;D4=18表示确诊满3月但未满4月有18例死于原发性肺癌。

第(5)栏为期初观察人数Lk,指tk月初尚存活的病例数。此栏自下而上累计求得,计算公式为:

Lk?Lk?1?Ck?Dk (15.8)

如本例L8?4,则L7?L8?C7?D7?4?0?2?6,L6?L7?C6?D6?6?1

?1?8,余类推。

第(6)栏为校正人数Nk,相当于实际观察人月数。凡在t月内截尾的病例都被当作平均观察了半月时间,因此校正人数Nk等于月初观察人数减去当月截尾人数的一半,其计算公式为:

15-10

第八章随访资料的生存分析

第十五章生存分析?(t)?P(T?t)?tk时刻仍存活的例数Skk观察总例数(15.4)式中T为观察对象的存活时间。但如果含有截尾数据,分母就必须分时段校正,故上式一般不能直接使用,大多采用概率乘法原理估计生存率。L,pk,假定观察对象在各个时段的生存事件独立,生存概率分别为p1,p2,则根据概率乘
推荐度:
点击下载文档文档为doc格式
5yoss5y5cy0088t3x4ji0cqsi0v0jd00p9t
领取福利

微信扫码领取福利

微信扫码分享