191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214
者应根据期中分析结果尽早暂停或结束抗肿瘤活性不足或安全性水平不可接受的队列入组,或提早终止失败的研究项目。
对于拟进行注册的扩展队列研究,应明确区分用于建立药物活性假设的患者群体和用于确认该假设的患者群体。为了达到验证试验假设的目的,建议对用于确认假设的患者群体开展独立的临床试验,特别是当FIH研究已对研究人群和样本量进行过多次变更时。如果试验未设置阳性对照组,则其数据必须非常有说服力,才能确证药物的有效性。对于两种新型试验药物联合治疗的研究,除非对每种药物的贡献都有很好的理解,且能合理分离每种药物的单独贡献,否则不宜采用单臂试验。 四、确证性试验
(一)一般考虑
在设计确证性试验时,申办者应根据临床试验的目的明确要估计的治疗效应。申办者在方案中应阐明研究人群、终点指标、治疗方案,应考虑试验过程中可能发生的影响治疗效应估计的伴发事件,如死亡、转组等,群体层面的汇总统计量、统计模型以及相应的敏感性分析也均应事先定义。
虽然减少研究人群的异质性可能会提高统计检验效能,但对目标人群的限制会使新药在实际应用中的效果难以评估。应基于证据选择最佳可用的治疗作为对照。因此,根据情况一般可以选择BSC,SOC或研究者选择性治疗作为对照。
盲法设计是确证性试验控制偏倚的重要手段之一。如果因不同药物间毒性特征差异明显而使用开放设计时,必须采取所有可能的措施来控制潜在的偏倚,比如对申办者试验团队遮蔽关键数据。无论采用开放设计还是双盲或单盲设计,对于重要且潜在的可能影响药物疗效的基线协变量,建议在随机化时予以考虑,对基线协变量的校正分析应在方案以及统计分析计划中事先
9
215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237
规定。当使用预测性生物标记物进行分层时,必须预先规定生物标记物及其确定生物标记物状态(阳性或阴性)的界值,且界值的确定方法必须经过科学验证并得到公认。
确证性试验的整体I类错误率必须严格控制在一定水平。如果研究的主要目的中包括对多个人群(例如生物标记物阳性人群和所有患者人群)或多个终点(例如OS、PFS和ORR)进行假设检验时,或者计划因有效而提前终止试验的期中分析时,应选择合适的多重性控制策略,并在方案以及统计分析计划中事先进行详细规定。计划因有效而提前终止试验的同时需要考虑安全性评价数据的充分性。
确证性试验设计对统计学考虑要求较高,申办者应就确证性临床试验方案以及统计分析计划中关键技术问题与审评机构开展沟通交流。
(二)试验设计
传统的固定样本量的研究设计用于抗肿瘤药物临床试验时,可参考如ICH E9等相关的指导原则。随着抗肿瘤药物研发的快速发展,一些新颖的试验设计在确证性试验中得以合理应用,包括II/III期无缝设计、生物标记物引导的设计和主方案设计等,大大提高了临床研发的效率。
1. 成组序贯设计
成组序贯设计通常用于按时间顺序进行的数据监测。在设计成组序贯试验时,申办者应仔细考虑计划进行的期中分析次数和时间点,以及合适的α消耗函数。对于因有效性而提前停止的试验,鼓励申办者继续随访试验直至数据成熟,以更好地了解试验药物的长期临床获益。
当期中分析或最终分析的时间点是由事件驱动时,主要数据集的确定应基于达到目标事件数量时的截止日期。在揭盲分析之前应确保在盲态状态下
10
238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260
完成数据的收集和清理。由于可能存在收集偏倚,揭盲之后收集的数据将受到严格审查,甚至从分析集中排除。
2. II/III期无缝设计
传统药物研发遵循先进行II期试验,再进行III期试验的序贯方法。II期试验用于临床概念验证、剂量选择、人群选择甚至终点选择。在获得II期数据后会决定是否开始III期研究。III期试验需要时间来计划、启动和实施。无缝II/III期设计试图消除II期和III期试验之间的空白期。可以采用操作无缝设计,将II期试验受试者排除在主要分析之外,也可以采用推断无缝设计,在主要分析中纳入II期试验受试者。前者不需要对I类错误的控制进行多重性调整,但对于后者,则可能需要根据适应性的性质和假设检验策略做出相应的调整。适应性设计的具体操作可参考国内与适应性设计有关的指导原则。
在决定采取无缝设计而不是序贯设计之前,应考虑两个重要因素。首先,从II期试验无缝过渡到III期试验时有足够的信息来支持合理决策。这通常取决于参与II 期数据分析的受试者人数以及II期试验采用的终点指标是否对决策有帮助。第二,操作层面上可以顺利实施。无缝设计要求能够迅速地对数据进行清理和分析,快速增加III期入组人数,并能够加快药物上市的进程。决定采用操作无缝设计或者推断无缝设计的关键考虑因素在于II期试验中适应性决策的复杂性。一般来说,和操作无缝设计不同,II期和III期试验结果之间的一致性对推断无缝设计来说更为重要。
虽然无缝II/III期设计在加速药物研发方面具有很好的前景,但在采取此策略之前,需要全面权衡不同方法的优缺点。在开始试验之前,需要解决试验操作方面和统计方面的问题,并与监管部门进行沟通。
3. 生物标记物引导的设计
11
261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282
为了优化试验药物的获益-风险特征,确定适当的目标人群至关重要。合适的生物标志物可以通过各种不同的诊断方法(如转录物的表达谱分析、差异抗原表达、遗传诊断,包括下一代测序等)来识别和测量。由于多种可能性的存在,判断哪些生物标志物可以预测药物活性,以及如何在早期开发过程中确定生物标志物的临界值仍是一个挑战。为减少选择偏倚,应事先将研究受试者分成两组,并指定用于发现和确认生物标志物的训练集和验证集。每次调查新的生物标志物时,都需要重复这个产生和检验假设的过程。基于单臂试验发现的预测型生物标志物,不论其研究实施得如何严格,实际仍存在只是一种预后型生物标志物(可采用前瞻性流行病学研究以评估其预后效果)或者是仅能预测短期肿瘤反应的生物志记物(需要进行更长时间的随访)的可能。
在随后的确证性试验设计中,必须考虑到上述不确定性。例如,当涉及到两个亚组人群之间的α分配时,若采取逐步下降法,则需要非常确定检验的层级性,而前期数据对此无法提供充分支持,此时最好能选取恰当的方法进行α拆分。此外,对于I类错误率控制的考虑,在涉及人群选择和扩展的统计设计中会更加复杂。在正式开展试验前,应衡量各种设计方案的利弊,并妥善解决监管部门所关注的问题。
4. 主方案设计
在单一方案下同时检测多种试验药物和/或多个肿瘤适应症,且无需为每次试验制定新方案的试验设计,称为主方案设计。它包括篮式设计、伞式设计和平台设计。在研究多个预测型生物标志物的情况下,主方案设计会变得更加复杂。
12
283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305
在有或无生物标记物富集的患者人群中同时研究一种试验药物在多个肿瘤适应症中的试验,被称为篮式试验。确证性篮式试验的主要研究人群通常包括具有独特分子标记的患者。
考虑到无效的肿瘤队列可能会稀释整体治疗效果,因此肿瘤适应症的初步选择必须基于重要的科学和临床证据,以便为数据合并奠定坚实的基础,降低试验失败的风险。基于期中分析数据将疗效较差的肿瘤队列从最终的合并分析中去除可以进一步将风险降至最低,但可能会导致整体I类错误控制方面的问题,需要进行适当的多重性调整。去掉无效队列后,剩余肿瘤队列的样本量也将进行重新调整,以维持最终合并分析的统计效能。在这种情况下,样本量重新调整策略必须事先制定并与监管部门达成一致。如果I类错误能够得到适当控制,确证性篮式试验也可以考虑其它如贝叶斯等设计方法。
无论采用哪种设计方法进行篮式试验,在合并分析中拒绝全局原假设并不意味着试验药物在所有参与合并分析的肿瘤适应症中同样有效,也不意味所有适应症均应获得批准。就基线特征对治疗效果的影响而言,与传统的III期试验相似,监管部门基于确证性篮式试验做出是否批准药物上市或同意说明书范围的决定将取决于额外分析的结果(例如合并分析中的治疗效果是否主要由某特定肿瘤适应症子集所决定,试验药物的获益-风险特征在单个肿瘤队列中是否有利)。另外也可能需要通过上市后研究进一步证实临床获益。
作为篮式试验的补充,伞式试验可以在同一肿瘤适应症中同时研究多种试验药物。伞式试验中试验药物可以持续的加入或移出。当有多个试验组(或药物队列)开放入组时,应该采用随机化设计。随机化比率可以根据试验中新出现的数据进行调整,以倾向于更有前景的治疗组,并提前终止无效治疗组。由于试验药物的研究是在同一个平台上进行,且通常在某些特定的
13