71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94
与OS一样,ORR一般应在ITT人群(单臂设计里的全部治疗人群)中进行分析,探索性试验也应如此。在ITT分析中,对于第一次肿瘤评估之前退出试验的受试者,不论何种退出原因,都被认为是非缓解者。ITT分析可以使当前试验结果与历史对照结果的比较更可靠,因为后者通常基于确证性试验中的ITT人群。同样,缓解评估应基于与历史对照相同的缓解标准才具有可比性。例如,如果历史对照数据是基于RECIST缓解标准,那么在当前试验里也应该使用同样的标准。
(三)无进展生存期(PFS)
无进展生存期是指从随机化开始(或单臂试验中治疗开始)至肿瘤进展或死亡(以先发生者为准)的时间。与PFS类似的终点还包括无病生存期(Disease Free Survival, DFS),是指从随机化开始(或单臂试验中治疗开始)至疾病复发或任何原因导致死亡的时间,多用于评价手术治疗或放疗后的辅助治疗。无事件生存期(Event Free Survival, EFS)是指从随机化开始(或单臂试验中治疗开始)到首次发生以下任何事件的时间:疾病进展而无法进行手术治疗、局部或远处复发、任何原因导致的死亡等,多用于评价手术治疗或放疗前的辅助治疗。类似的终点还包括至疾病进展时间(Time To Progression, TTP)和至治疗失败时间(Time To Treatment Failure, TTF),但这两种终点的分析结果通常不能作为研究结论的主要证据,因为它们包含的生存信息不如PFS充分。
肿瘤进展的确切定义对基于肿瘤测量的终点至关重要,应事先在方案中予以明确。与ORR一样,进展的定义应遵循既定的缓解评估标准。同样,对于拟进行注册申报的试验,主要PFS分析通常应基于盲态独立中心审查委员会(BICR)评估的肿瘤测量和缓解评估,但应尽量减少研究者和BICR之间评估的不一致(如对各中心研究者进行适当的培训和教育)。与ORR不同,
4
95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118
PFS在单臂试验中难以解释,因为一些受试者即使没有积极治疗也可能维持很长时间的病情稳定。因此,以PFS为主要终点的注册试验必须设置对照组。
区间删失,即疾病进展发生在肿瘤评估时间点的区间中,是PFS分析所面临的一个挑战性问题。在肿瘤评估时,根据相关标准判断为疾病进展实际上仅意味着在上一次评估和当前评估的某个时间点发生了进展。由此导致的结果是PFS的判定受到评估时间设计的影响。如果试验组和对照组的评估时间间隔不同,则PFS中位生存期的比较将会被引入偏倚。尽管基于区间删失的分析方法能在一定程度上考虑个体间采用不同评估时间设计对PFS的影响,但是为提高估计的准确性,降低分析和结果解释的复杂性,强烈建议采用相同评估时间的设计。信息删失是PFS分析的另一个更具挑战性的问题。信息删失可能由多种原因导致,常见的有四种:①尽管没有疾病进展的证据,但受试者可能在试验期间使用了其它某种抗肿瘤治疗而违背了方案;②受试者可能基于某中心研究者的进展判断而终止治疗,但评估结果被BICR否定;③受试者可能在没有任何疾病进展的证据下因毒性而终止治疗,如果肿瘤评估因此停止,其真实结果将是未知的;④由于基础疾病的恶化,受试者的实际评估时间可能偏离计划时间。在随机双盲试验中,当试验药物与对照药具有相似的安全性特征或选择BICR时,可有效降低信息删失带来的影响。然而,当随机试验是开放性的或涉及具有不同安全性特征的试验药物时,容易受信息删失的影响。
对PFS的分析应遵循ITT原则。如果在计划外评估期间监测到进展,则应根据记录的进展时间作为进展日期,而不是基于计划的评估时间。分析时应确保使用所有受试者(包括那些终止治疗而没有记录进展的受试者)最新的肿瘤评估信息。删失时间分析可能有助于揭示两个治疗组之间的随访失衡。研究者和BICR对疾病进展评估的差异性是PFS分析中的重要问题。对PFS
5
119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142
分析时,应常规对此差异性进行分析,并研究其在组间是否平衡。生存数据分析的统计方法在很大程度上依赖于非信息性删失假设的有效性,当怀疑其有效性时,建议进行相应的敏感性分析。例如,针对上述导致信息删失的前两种原因,把进展的定义改为与临床判断更接近的治疗失败的敏感性分析。
PFS通常被视为右删失时间-事件变量,并采用与OS相同的方法进行分析。但要注意,在有些试验中,用中位PFS估计值解释药物疗效可能是不真实的。例如,两个治疗组的风险比反映了较大的治疗效果,但其中位PFS可能大致相同。这种情况下,在临床重要时间点(例如一年)的生存率和限制性平均存活时间(即部分生存曲线下面积)可能是可行的考虑指标。受试者遵循的相同评估时间表也会导致相同的事件时间。在Cox回归模型下估计治疗效果时,推荐使用精确(或近似精确)方法处理相同的事件时间。样本量计算时,应该注意由于区间删失而导致的信息丢失,因为将PFS视为右删失时间-事件变量的传统做法可能会高估检验效能。相对于至疾病进展时间,当评估时间间隔较长时,PFS的这个问题更为明显。
(四)患者报告结局(PRO)
患者报告结局是直接来自患者的关于其症状、健康相关生活质量、治疗依从性以及治疗满意度的报告。虽然在抗肿瘤药物临床试验中收集PRO数据越来越常见,但此类测量指标在评价方面尚存在诸多问题,如使用量表的信度、效度和反应度等。此外,PRO测量指标还容易受到缺失数据的影响,应该采用合适的方法处理缺失数据。因此该指标较少作为上市申请的主要证据。为了更好地理解试验结果的重要性和相关性,应该对PRO与其他疗效终点指标的关系进行探索。 三、探索性试验
(一)剂量探索设计
6
143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166
I期抗肿瘤药物临床试验通常是试验药物首次进入人体(First in Human, FIH)的试验。I期临床试验剂量递增的原则是尽可能避免受试者不必要地暴露于低于或高于治疗剂量的治疗(即尽可能多地在治疗剂量范围内治疗受试者),同时保证安全性和快速入组。I期临床试验的剂量递增方法分为两大类:一是基于规则的设计,包括传统的3+3设计及其衍生设计,不依赖于统计建模;二是基于模型的设计,如连续重新评估方法(Continuous Reassessment Method, CRM)。一些新兴的模型辅助方法如改良毒性概率区间(Modified Toxicity Probability Interval,mTPI)设计和贝叶斯最优区间(Bayesian Optimal Interval,BOIN)设计,虽然基于模型而建立,但允许预先指定剂量递增的规则。这些方法易于实施,具有选择目标毒性概率和队列大小的灵活性,还具有与基于模型的设计相当的性能。
为了尽可能减少接受可能低于治疗剂量的受试者人数,I期剂量探索可从加速滴定设计开始,加速滴定部分通常在每个剂量水平招募1-3名受试者,并以发生2级或更高的非疾病相关毒性事件作为结束。加速滴定部分结束后,将采用正式的剂量递增方法进行剂量探索。在某些情况下,也可考虑采取患者内剂量递增(即受试者在后续治疗周期中的剂量水平高于其在第一个周期接受的剂量),但通常会导致第一个周期之后的安全性和耐受性数据难以解释。通常情况下,单药治疗和联合治疗的剂量探索会平行进行。联合治疗的起始剂量应低于单药治疗安全耐受剂量的一个或两个剂量水平。在将最大可耐受剂量(Maximum Tolerable Dose,MTD)确定为候选II期推荐剂量(Recommended Phase 2 Dose,RP2D)之前,应有足够数量的受试者接受了该剂量治疗。
剂量选择对肿瘤药物研发项目的成功具有重要作用。RP2D不一定必须是MTD或当药物在所有研究剂量水平下均安全且可耐受时的最大给药剂量
7
167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190
(Maximum Administrated Dose,MAD),它的确定还需要综合考虑药代动力学(Pharmacokinetics, PK)、药效学(Pharmacodynamics, PD)以及所有周期的安全性数据。如果仍存在不确定性,可能需要继续进行多于一个剂量的进一步研究。同种药物在单药治疗和联合治疗之间,实体瘤和血液瘤之间,或不同线次治疗之间估计的RP2D都可能不同。
(二)单臂试验和首次人体队列扩展
在抗肿瘤药物研发中,通常会在剂量探索阶段结束后在一个或多个肿瘤适应症中开展单臂试验。这些肿瘤适应症队列可以由同一治疗线次的不同肿瘤类型,或同一肿瘤类型的不同治疗线次,或两者的组合形成。队列中的受试者可以接受试验药物作为单药治疗或联合治疗(如与标准治疗或另一种试验药物联合)。
单臂试验的研究方案应当包含足够的信息,以说明其基于队列研究目的所确定的样本量估计的合理性,并明确试验药物的抗肿瘤活性大小及需要对其开展进一步研究的依据。在非随机队列中,抗肿瘤活性的评估通常采用多阶段设计来确定,以限制暴露于无效药物的额外患者数量。方案还应提供关于是否暂停入组的详细信息以及受试者参加期中分析的最短随访时间。若需要比较不同给药方案(如两种候选RP2D,或单药疗法和联合疗法)之间的安全性和抗肿瘤活性,则需开展更严格统计设计的随机队列。
若在FIH研究中开展单臂试验设计,开始时可能缺乏关于试验药物代谢动力学的足够数据,或未进行足够的安全性评估,此时如果快速入组,特别是在有令人兴奋的初步信号时,可能使大量受试者暴露于疗效未知和毒性特征不清楚的药物。为了减轻这种风险并保护受试者,申办者必须建立一套完善的操作流程,以方便数据收集,实时快速地评估新数据,向研究者、机构审查委员会(Institutional Review Board, IRB)及时公布期中分析结果。申办
8