样本量计算教程:非劣效性试验+生存分析
医咖会之前推送过的“非劣效性试验的样本量计算”教程中,研究结局是连续变量或者分类变量,那如果是生存数据,又该如何计算样本量呢?
一、研究问题与数据
某研究者拟开展一项非劣效的随机对照试验,探讨某免疫抑制剂对肺癌的疗效。估计对照组的中位生存时间(mOS)为8月,假设试验组相对于对照组的HR的非劣效性界值为1.3。研究的入组时间预计为T1=10月,随访时间计划为T2=12月。试验组对照组比例1:1。取α=0.025(单侧),把握度1-β=0.8。则需要多少样本量?
二、对问题的分析
在介绍样本量计算之前,首先介绍几个参数的概念。
1. 中位生存时间mOS:即50%的患者死亡时所对应的时间。如果将所有患者生存时间按从小到大排序,中位生存时间即顺序处于中间的患者的生存时间。
2. 入组时间:入组患者很难瞬间完成,尤其对于发病率比较低的肿瘤,因此患者入组往往要经过相对较长的时间。入组时间为第1例患者入组到最后一例患者入组所经历的时间。
3. 随访时间:在最后一例患者入组完成后,还需对所有患者随访一段时间。从最后一例患者入组,到试验截止日期的间隔称为随访时间。注意,这里的随访时间,跟患者的观察时间意义不同。
如果一个临床试验入组时间为12个月,随访时间为24个月,那么对于第一例入组的患者,其观察时间最长为12+24=36个月(尽管该患者可能在试验截止前就已死亡)。而对于最后一例入组的患者,其最长观察时间为24个月,即各个患者观察时间不同。观察时间越长,观察到结局发生的可能性越大。
如图1的3号患者,其观察时间(33个月)大于研究的随访时间(24个月)。
图1. 入组时间、随访时间和观察时间示意图
4. 入组模式
是指研究对象入组的速度是匀速(等比例)还是非匀速。常见的入组模式是匀速入组,即单位时间内,研究对象入组的数量相等(图2)。
图2. 匀速入组示意图
5. HR:风险比,是两组患者瞬时死亡概率之比,是衡量干预效果最常用的参数。
除此之外该类参数还有死亡风险(Hazard Rate),死亡率(Mortality,如5年死亡率),生存率(Proportion Surviving)。这些参数都可以进行相互换算,例如在生存数据满足指数分布假设下,试验组与对照组的:
HR可近似计算为:
6. HR的非劣效性界值:根据既往文献、临床意义选定。HR的非劣效性界值为1.3表示,试验组与对照组的HR值不大于1.3时,则认为试验组药物不劣于对照组药物。
7. 检验水准α和把握度1-β,与其他样本量计算意义相同,不再赘述。
三、PASS软件操作
本文仅以mOS为例,介绍PASS软件的操作。如使用其他参数,可以按照公式进行推算后,再在PASS中计算。
1. 选择Non-Inferiority → Survival → Logrank Tests for Non-Inferiority
(或者Survival → Logrank → Non-Inferiority → Logrank Tests for Non-Inferiority,两者是一样的)
2. 如下图填写相对应的参数后,点击Run。
参数说明:
1. 对照组Hazard Rate: 可根据Hazard rate = ln2 / mOS 计算得到。本例中,对照组Hazard Rate = ln2 / 8 = 0.086643398
2. Proportion Lost or Switching: 是指两组失访和转变治疗组的比例,可根据实际情况填写。本例中未设定。
四、结果解读
结果有两个,首先给出的是样本量,即两组各需要299名患者,总样本量598。
然后给出的是试验所需的死亡事件数,即该试验需要457例死亡事件。
注:① 决定试验Power的因素,实际上是死亡事件数而不是样本量本身,死亡事件数由α、β和HR三者决定。样本量是通过需要的死亡事件数、两组的死亡概率和试验持续时间推算出来的。
试验持续时间越长,获得同样的死亡事件数量所需的样本量就会越小,有兴趣的小伙伴可以延长随访时间加以验证。其他参数对样本量的影响涉及复杂的样本量计算过程,在此不做详述。
② PASS中参数不能直接填写入组速度。有时入组速度是受现实情况影响较大的因素,本例中入组速度需要59.8/月,研究者需要估计试验能否达到这样的水平,如果高于此水平,可以缩短入组时间,如果低于此水平则必须延长入组时间,然后重新计算样本量。
五、撰写结论
本研究为非劣效的随机对照试验,采用Logrank法比较两组患者生存时间的差异。估计对照组的中位生存时间(mOS)为8月,假设试验组相对于对照组的HR的非劣效性界值为1.3。
试验需要598例研究对象(两组分别299例)才能在α=0.05(双侧)的显著水平下获得90%的把握度检测到此差异。试验计划入组10个月,随访12个月,在发生457例死亡事件时进行最终分析。
延伸阅读:生存分析的方法
生存分析主要涉及到三种方法:
1) 非参数法:Logrank检验等
2) 半参数法:Cox回归分析
3) 参数法:生存数据服从特定分布如指数分布、weibull分布时采用的分析方法
非参数检验对数据分布的要求较低,因此结果更加可信,一般肿瘤试验主要结局的分析都要基于非参数检验法。非参数检验法又分Logrank检验,Wilcoxon检验等,区别在于对死亡事件的早晚有不同的权重。Logrank检验对晚期死亡事件权重较大,而Wilcoxon检验等对早期死亡事件权重更大。一般肿瘤治疗药物临床试验会采用Logrank检验法。
非参数法主要用于比较两组生存曲线是否存在差异,回答“是否有效”的问题,但无法衡量效果大小。我们希望能够获得一个指标更直观地测量治疗效果,通常会采用HR,而HR要通过Cox回归才能获得,因此临床试验中也要用到Cox回归计算干预措施的HR,但用Logrank检验的P值作为试验主要结局是否阳性的依据。另外,在次要结局和探索性分析中,往往会采用Cox回归进行分析。
参数法对数据分布的要求较高,它假定数据服从一定的分布,一般不采用。
临床试验中样本量的计算要基于主要结局的分析,因此多基于Logrank法。
医咖会出了一套样本量计算教程(PPT+视频):主要针对常用的样本量计算方法,如RCT/队列研究、病例对照研究、横断面研究等。全套PPT+视频售价19.9元,有需要的伙伴,请与小咖(微信:xys2016ykf)联系。