袁鹰、罗晟教授:So easy!用自主招生打开临床试验的多重性调整…

临床试验中普遍存在多重性(multiplicity)问题,它是指在一项完整的研究中,需要经过不止一次统计推断(多重检验)对研究结论做出决策的相关问题。例如,多个终点、多组间比较、亚组分析、期中分析、纵向数据不同时间点的分析等方面。

而对于确证性临床试验,将总I 类错误率(FWER)控制在合理水平是统计学的基本准则,也是统计学审评的关键之一。换句话说,上述多重性问题有的可以导致FWER膨胀,即获得“假阳性”结果的概率增加,需要采用恰当的策略与方法将FWER控制在合理水平,这一过程称为多重性调整。

用自主招生打开多重性调整
某某大学派了若干老师到某地自主招生,但名额有限,且只有半天时间。老师们商量后表示,既然名额有限,只考虑笔试的前20名(主要终点),从中选出最优秀的学生。
老师A(Bonferroni):常规做法是每个人都面试,谁最优秀招谁。
然而,平均分配一样的面试时间,虽然这样的方案简单又公平,但并没有足够的时间充分了解每一个学生,从而选择最合适的人。
老师B(Holm):不如把学生按照笔试成绩的分数从高到低排序,从高分开始面试,直至第一个觉得不合格的学生,就停止面试。通过面试的学生全部录取,后面的全部刷掉。
老师C(Hochberg):还可以这样,把学生按照笔试成绩的分数从高到低排序,从低分开始面试,直至第一个觉得合格的学生,就停止面试。没有参加面试的高分学生全部录取,低分不合格的全部刷掉。
老师D(Fixed-sequence):分数不能代表一切。还可以综合笔试成绩、综合素质各方面的能力,把学生按照简历评分从上到下排序依次面试。直至第一个觉得不合格的学生,就停止面试。
老师E(Fallback):不妨把面试时间根据简历评分排序,排名靠前的学生时间分配长一些,排名靠后的时间短一些。如果有的学生不需要面试很长时间就知道他很优秀,节省下来的时间可以回收,给后面的学生多一点机会。
故事里的五位老师,都是谁?
1、Bonferroni 法
Bonferroni 法的基本思想是各个独立假设检验的名义检验水准αi 之和等于α。
例如,某临床试验设有 3 个主要终点,需要进行 3 次假设检验,设定α=0.05。如果3个主要终点的重要性相同,则每个假设检验的αi相同,均为 0.0167(=0.05/3),则每个假设检验的 P 值小于 0.0167才被认为有显著性;如果 3 个主要终点的重要性不同,如设置α1、α2和α3分别为0.030、0.015 和 0.005,则每个假设检验的P值小于所对应的αi才被认为有显著性。
优点:1)简单、广泛使用;2)如果某个特定研究终点通过显著性检验,则α值可以回收给其他终点(如次要终点)
缺点:在各个研究终点之间有潜在相关性的情况下,Bonferroni 法相对保守
案例:IMpower133在第一次期中分析就达到共同主要终点,与方案从Bonferroni法变更为成组序贯加权Holm法有何关联?

重塑SCLC格局、改写NCCN指南!IMpower133试验设计背后的奥秘
2、Holm(Step-down)法
Holm 法是一种基于Bonferroni 法的检验统计量逐步减小(P值逐步增大)的多重调整方法。
例如,该法首先计算出各假设检验的P值后,然后按照P值从小到大顺序依次与相对应的 αi进行比较。第一步从最小的P值开始,检验原假设H0,如果 P1>α1(=α/m),则不拒绝原假设 H0,并停止检验所有剩余的假设;如果 P1≤α1,则拒绝 H0,HA成立,进入下一步假设检验;以此类推。
优点:1)相比Bonferroni 法的效能更大;2)从最小的P值开始检验,不用提前知道具体的研究终点。相比前瞻性的固定顺序法更加灵活
缺点:一旦某个特定研究终点没有通过显著性检验,停止检验所有剩余的假设,则剩余的α值不能回收给次要终点
3、Hochberg (Step-up)法
Hochberg 法是一种基于Simes法的检验统计量逐步增大(P值逐步减小)的多重调整方法。
优点:相比Bonferroni法的效能更大,相比Holm法的效能可能更大
缺点:Hochberg 法在满足多重检验之间互相独立时才能实现控制 FWER
4、固定顺序法(Fixed-sequence)

固定顺序法是指按预先定义的顺序进行假设检验,每个假设检验的名义检验水准αi与α相同,只有在上一个假设检验拒绝原假设时才进行到下一个假设检验,直到某一个假设检验不拒绝原假设为止,而最终的推断结论为该假设检验前面的显著性结论均被接受。与Gatekeeping检验策略类似。
优点:每个假设检验的名义检验水准都与α相同,不需要调整
缺点:1)统计结果与假设检验的顺序高度相关;2)如果某一个假设检验不拒绝原假设,则不能进行到下一个假设检验(即使P值非常小)
案例:DESTINY-Gastric01研究的次要终点在2019 年进行了重大调整,对于FDA加速审批起到怎样的关键作用?

阿斯利康69亿美元收购的DS-8201,临床试验设计有何奥秘?
5、回退法(Fallback)
回退法需事先根据固定顺序法对各假设检验排序,并确定每个假设检验的名义检验水准 αi,然后依顺序进行假设检验。该法首先在α1水平检验H01,如果不拒绝H01,则在α2水平检验H02;如果拒绝H01,则在α1+α2水平检验 H02,余类推。
如,一项研究采用 Bonferroni法和Fallback法控制一类错误率为单侧0.025,首先用Bonferroni方法将单侧显著性水平0.005分至PFS的检验,0.02分至OS。如果PFS的统计结果显著,则将0.005传递给OS,OS将基于0.025 整体显著水平进行检验。
优点:1)相比Bonferroni法的效能更大;2)如假设检验1被拒绝,则相应的I类错误概率(α)可被回收到用于假设检验2的检验,而不导致α膨胀
缺点:统计结果与假设检验的顺序高度相关
小结
如前文所述,Bonferroni、Holm、Fixed-sequence、Fallback等方法是多重性调整策略的基石。然而,通常一个试验中不仅仅涉及一类多重性的情形,往往是多个情形混合在一起,如需要同时考虑多个终点、多组的比较、多个人群和多个时间点的期中分析,就会出现如下图所示的复杂情况。
如三阴性乳腺癌IMpassion130研究虽然OS没有达到统计上的显著,但因为多终点设计的特殊性,凭借PFS的阳性结果最终获得了FDA批准。而肝癌二线治疗KEYNOTE 240研究中,尽管K药组的PFS和OS都有一定程度的改善,却均未达到预设的统计学差异。正可谓是,失之毫厘,差之千里。
关于临床研究终点设计专栏课程

看完上面生动形象的比喻和诠释,是不是大呼过瘾?但与此同时,是不是觉得意犹未尽,心头仍有很多问题没有解开?在被全球顶级临床试验协会(SCT,Society for clinical trials)遴选为官网培训的临床研究终点设计专栏课程中,袁鹰教授和罗晟教授展开了非常详尽的理论剖析和答疑互动。欲听国际水平课程的中文版?扫码下方二维码,精彩不容错过:

参考资料:

1.MultipleEndpoints in Clinical Trials. FDA Guidance for Industry. January 2017.

2. CDE《药物临床试验多重性问题指导原则(试行)》.2020年12月.

3. 注册临床试验方案沟通交流常见的统计学设计问题. 中国新药杂志2020年第29卷第22期.

多重性问题(multiplicity issues):在一项完整的临床研究中,需要经过不止一次统计推断(多重检验)对研究结论做出决策的相关问题。

多重性调整(Multiplicity Adjustment):采用恰当的策略与方法将总I类错误率控制在合理水平的过程。

I类错误:原假设(无效假设)正确但检验结果拒绝了原假设的错误,相当于把实际上无效的药物经统计推断得出有效结论的错误。其概率需控制在某一水平,该水平称为检验水准,或称显著性水准,用α表示。

总I类错误率(Familywise Error Rate,FWER):同一临床试验所关注的多个假设检验中,至少一个真的原假设被拒绝的概率。

主要终点(Primary Endpoint):是指与临床试验所关注的主要问题(主要目的)直接相关的、能够提供最具临床意义和令人信服的证据的终点,常用于主要分析、样本量估计和评价试验是否达到主要目的。

点亮“在看”,好文相伴

(0)

相关推荐

  • 什么是Bonferroni校正?

    对于统计学假设检验来说,多重检验校正是一个非常重要的领域.我们再进行假设检验的时候,通常会设置一个零假设,之后计算出一个p值,即数据分布符合原假设的概率,p值越低,即代表拒绝原假设的概率越大.我们通常 ...

  • 方差分析中的方差齐性检验

    方差分析中的方差齐性检验_方差齐性检验结果分析_方差分析 齐性检验 方差分析时的方差齐性检验是方差分析的前提条件,还是只是后面进行均值的多重比较时选择分析方法的依据?看过几本书,这两种观点都有.我看方 ...

  • R语言多重比较示例:Bonferroni校正法和Benjamini & Hochberg法

    原文链接:http://tecdat.cn/?p=21825 假设检验的基本原理是小概率原理,即我们认为小概率事件在一次试验中实际上不可能发生. 多重比较的问题 当同一研究问题下进行多次假设检验时,不 ...

  • 姜中、二中、罗塘、溱中,自主招生64人!

    姜堰区教育局公告 根据<泰州市普通高中特长生自主招生工作实施办法>,2021年省姜堰中学.省姜堰二中.罗塘高级中学.溱潼中学4所普通高中具备特长生自主招生资质,各校特长生招生项目和人数如下 ...

  • 罗龙辉教授常用皮肤病处方

    ​湖南中医药大学附属第一医院皮肤性病科罗龙辉教授常用经验方如下: 1. 小儿特应性皮炎,皮疹以屈側为甚,有渗液,瘙痒: 炒莱菔子10 防风6 白术6 炒麦芽10 炒谷芽10 太子参10 板蓝根10 蝉 ...

  • 北京大学罗莹教授:间充质干细胞外泌体功能化的材料支架促进组织修复 | Science Advances

    近日,北京大学罗莹教授课题组在Science Advances杂志上发表文章,报道了间充质基质细胞(MSC)外泌体功能化的纤维状聚酯材料支架,通过诱导先天和适应性免疫反应,促进组织损伤的修复. 免疫系 ...

  • 法定的一罪(2020年罗翔教授法考知识点小摘录)

    第一是集合犯 集合犯就是犯罪构成预定了数个同种类行为的犯罪.就是要反复.经常.多次实施,而不能仅仅是一次实施. 集合犯的典型包括常习犯(这个犯罪作为你的习惯).职业犯(这个犯作为你的职业)和营业犯(把 ...

  • 刑罚为了什么而存在?(2020年罗翔教授法考知识点小摘录)

    无罪不罚是刑罚的底线,绝对不能够为了追求美好的目标而任意惩罚一个人. 在人类历史上,关于为什么需要punishment 刑罚这个词呢?历来有两种针锋相对的观点. 一种观点认为有了犯罪所以需要刑罚: 而 ...

  • 追诉时效(2020年罗翔教授法考知识点小摘录)

    追诉时效就是对犯罪分子经过一定时间就不再追诉. (1)法定最高刑不满五年有期徒刑的,追诉期五年 (2)法定最高刑为五年以上不满10年有期徒刑的,追诉期10年 (3)法定最高刑为10年以上有期徒刑的,追 ...

  • 罗森教授系列演讲纪要:新国际秩序下的北朝、佛教和唐朝

    公元五至九世纪 2017年5月31日晚,"北京大学'大学堂'顶尖学者讲学计划--杰西卡·罗森教授系列讲座"的第四场于北京大学考古文博学院多功能厅举行.本场主持人北京大学考古文博学院 ...

  • 罗翔教授今天不说法,说说什么是好工作

    我记得,这位同学去年刚开始求职的时候很焦虑,非常害怕自己会找不到好工作,虽然这份担忧最终并没有成为现实,但他又陷入了选择的困惑中. 作为导师,我给他提供了一些个人建议,但提完建议我其实也在反省,自己的 ...

  • 贷款犯罪和洗钱犯罪(2020年罗翔教授法考知识点小摘录)

    首先是高利转贷罪. 高利转贷必须要以转贷牟利为目的,套取金融机构和信贷资金转贷他人.所以本罪它一定是一个目的犯,而目的犯只可能出现在直接故意中.很明显,牟利的目的一定产生在贷款前,所以你必须证明他贷款 ...