第十二章 生存时间资料的
非参数分析方法 目 录 第一节 生存时间资料的特点 第二节 小样本生存率的kaplan-Meier估计 第三节 大样本生存率的寿命表法估计 第四节 生存曲线比较的假设检验 第一节 生存时间资料的特点 一、数据结构 二、统计描述指标 三、资料要求 一、数据结构
在临床医学中, 对病人疗效考查: 治疗结局? 生存时间? 生存时间的三个要点 一、起始事件 二、 终点事件 三、生存时间 医学例子:起始事件 随访时间 终点事件
疾病确诊 死亡 随访(follow-up)资料的记录 生存资料一般通过随访收集, 记录的项目: (起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等) 分组变量(处理方法) 和其它协变量(性别、年龄、职业、文化程度等) 生存时间资料的特点 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 截尾数据:如表12-1中的1号和 3号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因: (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)预定终止结果迟迟不发生 分布类型复杂:生存时间分布常呈正偏态分布 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、
是否阳性等) 错误1:忽略生存时间,采用Logistic回归分析死亡率 错误2:忽略结局,采用t检验、线性回归分析生存时间 What is Censoring?(截尾问题) 得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全数据。或截尾数据、删失数据或终检值。 (如有确切的生存时间,则这种数据称为完全数据。) 两种错误的做法: 错误1:丢弃截尾数据,只考虑确切数据。(损失了信息) 错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。 两种错误的做法: 错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 ) 二、生存分析的统计描述指标 [例1] 手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60 注意:死亡率与死亡概率的分子相同,但分母不同; 生存概率与生存率的分子相同,但分母不同 1 . 死亡率、死亡概率、生存概率 (1) 死亡率 (mortality rate,death rate) 表示某单位时间内的死亡强度。 年平均人口数=(年初人口数+年末人 口数) (2) 死亡概率 ( mortality probability ) 指死于某时段内的可能性大小。 = d/n0 年内有删失,分母用校正人口数: 校正人口数= 年初人口数―删失例数 / 2 =n0-c/2 (3) 生存概率 ( survival probability ) 指某单位时
段开始时存活的个体到该时段结束时仍存活的可能性的大小。 = (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数。 生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历t个单位时间后仍存活的概率。 生存概率指单个时段的概率, 生存
率指从0~t多个时段的积累概率。 公式1 用于完全数据 =(n0-d)/N 公式2 用于 删失数据以及完全数据
S ( t ) = P (T ≥ tk ) = p1 p2 … pk 例如 手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。 试求各年的 生存概率和3年生存率。 解: 各年生存概率 p1 = ( 50