医院临床流行病学教资料

由天下分享时间：2025/2/16 3:48:40 加入收藏我要投稿点赞

医学检验方法学研究的设计和文献评价原则

中华医学检验杂志 2000年第6期第23卷科研设计点评

作者：吴泰相刘关键王家良

单位：华西医科大学附属第一医院临床流行病学教研室成都，610041

方法学研究在医学检验专业杂志所发表的文章中所占的比例，通常在50%以上。虽然，其中不乏优秀之作，但是，相当一部分文章从设计到指标的应用都有明显的缺陷。我们根据循证医学的原理，提出这类研究的设计和文献评价原则，并运用这些原则对我们认为有问题的典型文章进行分析，意在与同道们商榷，以促进我国医学检验方法学研究和论文水平的提高。

医学检验方法学研究的设计原则

1.确立金标准：新方法的研究，或两种方法以上的比较研究，首先应该确立金标准。如果无法采用直接证据作为金标准，则可采用公认较为准确的方法作为参照标准。

2.检测对象的选择：应包括（1）该方法能检测到的目标物，即阳性样本，比如考核乙型肝炎病毒标记物检测试剂必须包括各种类型乙肝病毒携带者；（2）无该方法所能检测到的目标物，即阴性样本。

3.样本大小（也称样本含量）的计算：样本含量大小并非任意确定。太小则不能证明该方法的有效性；太大则浪费人力财力。计算样本含量，首先估计样本中阳性与阴性样本的数量和比例，然后列出四格表(表1)：

表1 评价诊断试验的四格表

金标准被评价方法阳性阴性合计阳性真阳性a 假阳性b a+b 阴性假阴性c 真阴性d c+d 合计 a+c b+d N 则样本含量可用下式估算

式中p，P0分别为样本率、总体率，p-P0为允许误差，常取总体率（P0）的可信区间间距的一半；Uα查u值表，有单双侧之分，如α取值为0.05，则单侧Uα=1.64，双侧Uα=1.96。

4.阳性判定标准：是指对检测结果认定为阴性或阳性采用的标准，如酶联免疫吸附试验的常用阳性标准为：

5.盲法测定：为了避免知情者带着倾向性检测样本，导致敏感性、特异性和一致性高于真实值，应采用盲法测定。 6.列表分析评价和评价指标：

(1)列表：将金标准和待评方法所检测的结果分别填入四格表(表1)。对于两种方法之间的比较，则将金标准改为方法A，被评价方法改为方法B即可。 (2)评价指标：

一致性：对于计数指标，采用Kappa值评价一致性；而对于计量指标，则采用相关系

［］

数进行评价（另文讨论）。Kappa值2：是评价不同方法间，校正机遇一致率后的观察一致率的指标，常用于比较两者间的一致性。简化的校正后Kappa值计算公式为：

其中γ1=a+b，C1=a+c,γ2=d+c，C2=b+d。

Kappa值在0～1之间，其值与一致性强度的关系虽有争议，但在0.75以上时，认为具有高度的一致性。

如果比较2个以上的观察者，则采用分别的两两比较方法，如A和B，B和C，C和A，等等。

比较两种方法的差异求χ2值，使用卡方校正公式：

查表求得P值，可比较两方法的差异。

7.成本－效益和成本－效果分析：医学检验方法是直接用于临床诊断的，临床医师在作诊断和治疗决策时，应为病人选择最经济有效的诊断和治疗方案。因此，当介绍一种新的检验方法时，如果能对这种方法按照卫生经济学原则作出成本-效益或成本-效果分析，则对临床医师选择诊断方法不无裨益。

8.新方法在实际应用中的效果：按照循证医学的原则，诊断试验应该在实际应用中进行验证；这是因为有时在小范围内的严格实验，在实际应用中可能会出现新的问题。只有在实际应用中也能获得稳定结果的方法，才具有实用价值。评价原则和步骤 1.新方法是否设立了金标准？

2.新方法与金标准之间或不同方法之间的比较是否为盲法？

3.研究资料能否采用四格表进行分析？是否对方法的重复性、敏感性、特异性、一致性等指标进行了表述？（对于计量资料，可选择进行四格表分析。）

4.样本含量、所用标本组成和来源是否合理？是否包括了待测疾病的患者？ 5.操作步骤是否清楚？ 6.结果判断标准是否明确？ 7.正常值的确定是否合理、可靠？ 8.新方法在实际应用中能否获得可靠结果？ 9.新方法的实用性评价（包括成本－效益分析）。实际应用举例

运用本文提出的设计和文献评价原则，试对《丙型肝炎国产诊断试剂与第三代进口试剂

［］

的临床比较研究》3一文进行分析评价。

1.该研究是一个3种试剂的诊断一致性比较研究；没有采用金标准；研究目的是将国产试剂与两种国外主流试剂进行对照，指明了以A3、O3两试剂为参照。

2.虽然文中提到“将部分可疑样品送卫生部肝炎试剂中心用双盲法复核”，但对整个试验，即用三种不同的方法对同一批标本进行的检测，并未提到是否采用盲法。 3.研究资料不能采用四格表进行分析，也无评价指标。

为了帮助大家理解采用四格表的分析步骤，我们将原文的资料进行一些改动，假设将原文的判定标准作为金标准（注意：实际上是错误的），那么，我们可以计算出三种试剂的各项指标如下：

表2 XWK试剂与金标准比较的四格表

金标准新试剂XWK 阳性阴性合计阳性 373 7 380 阴性 1 3 057 3 058 合计 374 3 064 3 438 表3 XWK试剂与A3试剂比较的四格表

A3试剂 XWK试剂阳性阴性合计阳性 373 7 380 阴性 2 3 056 3 058 合计 375 3 063 3 438

敏感性=a/(a+c)=373/(373+1)=0.9973 特异性=d/(b+d)=3057/(7+3057)=0.9977 准确性=(a+d)/N=(373+3057)/3438=0.9977

同理，可分别将A3、O3试剂与金标准进行比较，本文为节约篇幅，将其略去。

因此，新试剂（XWK）在一致性、敏感性、特异性和准确性等方面均已达到或超过国外同类试剂的水平。（敏感性和特异性都达到0.99以上的检测方法几乎是没有的，本文只是以

此为例说明其计算过程。）又假设，我们对数据进行一些改动，使该研究符合两两比较的条件，则可计算新试剂与

国外同类试剂的差异如下：

两种试剂的差异无显著意义。同理，可比较XWK和O3试

剂的差异。

4.样本含量：对于比较新试剂与国外试剂的性能差异是否需要如此大的样本量？这是一个值得商榷的问题。如果已经对样本组成进行了选择，已包括了目标疾病的各种患者，我们

认为用不着再花如此大的功夫去筛查。计算样本含量需对新试剂的敏感性和特异性进行估计，一般比实际估计得稍低一点。设新方法的敏感性为90%（p1），特异性为80%(p2)，α=0.05(双侧)，δ＝0.08，则其样本含量应

为：

即阳性样本只需54例（可扩大为60例），阴性样本只需96例（可扩大为100例）；远

远低于该文所采用的样本量。可见，盲目确定样本量，将造成多大的浪费。

标本组成和来源：包括了目标疾病的患者。

5.操作步骤清楚。

6.判定标准不正确。其判定标准为三种试剂检测结果均为阳性者则定为阳性样品；对于可疑标本，即三种试剂中只有一种或两种测为阳性，而另外试剂测为阴性时，则用RIBA H

医院临床流行病学教资料

?医学检验方法学研究的设计和文献评价原则中华医学检验杂志2000年第6期第23卷科研设计点评作者：吴泰相刘关键王家良单位：华西医科大学附属第一医院临床流行病学教研室成都，610041方法学研究在医学检验专业杂志所发表的文章中所占的比例，通常在50%以上。虽然，其中不乏优秀之

推荐度：

点击下载文档文档为doc格式

医院临床流行病学教资料

医院临床流行病学教资料

相关推荐文档

精选图文

热门排序

推荐文章

热门标签

相关文章列表