好文档 - 专业文书写作范文服务资料分享网站

医学期刊编辑核查要点

天下 分享 时间: 加入收藏 我要投稿 点赞

医学期刊编辑核查要点

目前,医学论文中的生存资料(survivaldata)非常常见。笔者在万方数据库中以“生存分析或预后分析或cox”进行检索(检索条件为题名),共检索出文献2万6476篇(其中2021—2021年的文献1773篇),这还不包括其他中文数据库中收录的其他文献,或者题目中没有涵盖这些表述但实际进行了生存分析的文献,因此实际的生存分析文章远不止检索出的数量。这些论文中,生存分析涵盖了医学[1]、农业[2]、交通[3]等领域,可见目前生存分析的应用十分广泛。由于生存资料蕴涵有结局和时间2个方面的信息,单纯针对结局或时间的统计分析方法都不恰当,需采用特殊分析方法即生存分析。随着生存分析的广泛应用,医学论文中关于一些生存分析不恰当的表述、甚至生存分析统计方法的误用情况不断出现,严重降低了文章的质量。因此,笔者总结了医学期刊生存分析中的审查要点,以供编辑人员参考。 1统计描述部分

1.1注意生存概率和生存率的正确表述首先我们来看一下生存概率和生存率的定义。生存概率表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。某年生存概率的计算公式为:p=n1/n0,其中n1为某年活满1年人数,n0为某年年初观察人数;而生存率是指观察对象活过某时刻的概率,一般采用概率乘法原理估计生存率(如3年生存率等于第1年、第2年和第3年生存概率的连乘积)。医学论文中“1年生存率”“3年生存率”“5年生存率”的表述非常常见。但这种表述是否正确呢?这还要看作者是如何得出该数值的。若作者是根据生存曲线,取值1、3及5年对应的生存率,则表述正确。但若作者是根据观察例数和存活例数计算的,如3年生存率是计算的活满3年的患者数量在随访患者中所占的比例,则其本质是3年生存概率,则3年生存率的表述就欠妥。1.2生存曲线的审查要点既往有学者[4]详细总结了生存曲线的常见错误,包括曲线形状不规则、曲线上没有截尾数据、一批患者不同的分层曲线上截尾数据的有无不一致或例数不一致、曲线在后期或中期出现很长的平台及生存曲线横坐标为“0”时生存率不是“100%”,笔者在此不再赘述。本文总结了生存曲线的其他错误,如生存曲线包括了横纵坐标以外的坐标、生存曲线存在交叉、生存

1

曲线对应随访时间和文字结果不一致的问题。1.2.1生存曲线仅有横、纵坐标生存曲线的本质是线图。线图的要求是:纵轴一般以0点作起点,否则需作特殊标记或说明;各测定值标记点间以直线连接,不可修匀成光滑曲线。在实际工作中,编辑往往要求作者提供可供编辑的矢量图,通常是“emf”或“wmf”格式。而统计软件输出的统计图,如最常用的spss,其生存分析图片都是不符合编辑规范的,因此要求编辑在后期的校对时,将无关线条予以删除。而目前的医学论文中,很多生存分析曲线图都不是规范的统计图,如徐冉等[1]、傅文禕等[5]、张鹏等[6]的论文中,生存分析曲线图中都有一些无关的线条。1.2.2仅进行单因素分析时生存曲线不能交叉有些医学论文[5,7]中呈现的生存曲线是存在交叉的,这是生存曲线最常见的错误之一。关于生存曲线不能交叉的原因及应对策略,将在第二部分予以总结,此处不再赘述。1.2.3生存曲线最末一点对应的随访时间不应与文字相悖生存曲线依据生存时间绘制。医学论文中往往报道了随访时间,而最长生存时间和最长随访时间的关系是,最长生存时间≤随访时间。因此,若生存曲线中的生存时间长于文中的随访时间,则数据就存在较大的问题,需要编辑提出质疑,请作者核查。 2统计推断部分

2.1单因素分析时审查生存曲线是否存在交叉目前spss软件用于比较生存曲线的方法有log-rank检验、Breslow(Bs)检验(即gehan-wilcoxon检验)和tar-one-ware(tw)检验。目前医学期刊的“主流”方法是log-rank检验。其实3种检验方法有其适用条件,各有侧重:log-rank检验更注重“远期效应”,即生存曲线开始差距小,随时间推移逐渐分开的曲线适用log-rank检验(图1);Bs检验更注重“近期效应”,即生存曲线开始差距大,随时间推移逐渐接近的曲线适用Bs检验(图2);tw检验介于两者之间。由此可知,由于tw和Bs检验在前期赋予较大的权重,因此该2种方法对生存曲线后期的差异不敏感,因此不适合后期差异较大的生存曲线的比较。由于医学上对患者的随访,常常是开始生存情况较好,随时间延长生存率降低,生存曲线逐渐分开,因此log-rank检验在医学期刊中最常见。但log-rank检验有一重要条件(也是Bs检验和tw检验的重要条件),就是生存曲线不能交叉[8-9],因此进行生存曲线的绘制非常有必要。假设2条生存曲线有1个交叉点,交叉之前和交叉之后的生存情况完全相反,则

2

哪组的生存情况更好呢?无法判定。生存曲线交叉提示存在混杂因素。针对生存曲线交叉的情况,目前的处理方法有Reny(Re)、lin-wang(lw)和two-stage(ts)法,其中尤以ts法具有较好的适用性与稳健性[10-12],也可进行分层分析或构建cox比例风险回归模型控制混杂因素的影响。2.2多组生存曲线有统计学意义时审查是否需进行两两比较当涉及3个组别及以上的生存曲线的比较时,若总体有统计学意义,只能得出至少有2组比较差异有统计学意义的结论,但具体哪组好?哪组差?则需要通过两两比较来回答。生存分析的两两比较一般通过校正α来实现,通过Bonferroni过程、Dunn-?idák过程[13]、Benjamini-Hochbe过程、Benjamin-Yekutieli过程等[14]对α进行校正。但笔者认为这些方法较复杂,可通过构建多因素cox比例风险回归模型来解决,直接实现类别间的比较,而不需单独校正α。2.3多因素分析cox比例风险回归模型为最常用的多因素生存分析方法。医学期刊编辑在处理此类文章时,需从以下几个方面进行核查。2.3.1多因素分析审查样本量是否足够进行cox比例风险回归模型分析时,样本含量不宜过小。随着纳入变量的增加,样本量应有所增加。孙振球等[9]认为,cox比例风险回归模型分析时,样本量应该为纳入变量的5~20倍。如《28例同时多原发肺癌的生存分析及预后影响因素研究》[15]中,拟合了cox比例风险回归模型,显然样本量过少,结论有待商榷。2.3.2变量纳入方法审查cox比例风险回归模型和其他多因素模型一样,变量的纳入需考虑专业、临床实际、既往研究、变量之间的关系,进行综合选择。尤其需注意的是,变量的纳入不能单纯依靠单因素分析结果,即只纳入单因素分析时有统计学意义的变量[7,16-17],这是医学期刊多因素分析文章中最常出现的问题。例如,众所周知,肿瘤的tnm分期对于患者预后的影响是肯定的,分期越晚,预后越差。但如若单因素分析时,tnm分期并无统计学意义,多因素分析就不纳入了吗?答案是否定的。单因素分析之所以没有统计学意义,即是因为单因素分析时只分析了tnm分期一个变量,并未对其他混杂因素进行控制,因此导致了和临床实际相悖的结论。那据此就否定了单因素分析的价值吗?答案也是否定的。当病例数量较少,难以进行多因素分析时,单因素分析作为一种探索方法,对于各因素对预后影响的探索,也是很有必要的。2.3.3不同类型变量纳入形式核查在变量纳入过程中,对于计量资料,直接纳入模型即可,但对于计数资料,不同的计数资料类型有不同的

3

医学期刊编辑核查要点

医学期刊编辑核查要点目前,医学论文中的生存资料(survivaldata)非常常见。笔者在万方数据库中以“生存分析或预后分析或cox”进行检索(检索条件为题名),共检索出文献2万6476篇(其中2021—2021年的文献1773篇),这还不包括其他中文数据库中收录的其他文献,或者题目中没有涵盖这些表述但实际进行了生存分析的文献,因此实际的生存分析文章远
推荐度:
点击下载文档文档为doc格式
9gmd46208n3z01x0bvw21wxgu8k84a00nb7
领取福利

微信扫码领取福利

微信扫码分享