手把手教学:生存分析的样本量计算
一、临床研究问题
生存分析研究在临床上非常常见,例如肿瘤科大夫想要评价两种治疗措施对于患者生存期的影响,或者肿瘤复发的影响,一般要用到生存分析。
一般肿瘤治疗药物的临床研究,都会采用Logrank检验比较主要结局。本文将介绍如何利用PASS软件计算生存分析Logrank检验的样本量。本文适用于无期中分析的试验设计类型。对于有期中分析的试验,样本量计算涉及到α消耗函数等调整假阳性率的方法,需要其他模块完成。
二、样本量计算所需参数
在介绍样本量计算之前,首先介绍几个参数的概念。
1. 中位生存时间mOS:即50%的患者死亡时所对应的时间。如果将所有患者生存时间按从小到大排序,中位生存时间即顺序处于中间的患者的生存时间。
2. 入组时间:入组患者很难瞬间完成,尤其对于发病率比较低的肿瘤,因此患者入组往往要经过相对较长的时间。入组时间为第1例患者入组到最后一例患者入组所经历的时间。
3. 随访时间:在最后一例患者入组完成后,还需对所有患者随访一段时间。从最后一例患者入组,到试验截止日期的间隔称为随访时间。注意,这里的随访时间,跟患者的观察时间意义不同。如果一个临床试验入组时间为6个月,随访时间为12个月,那么对于第一例入组的患者,其观察时间为6+12=18个月(尽管该患者可能在试验截止前就已死亡),而对于最后一例入组的患者,其观察时间为12个月,即各个患者观察时间不同。观察时间越长,观察到结局发生的可能性越大。
4. 效果参数:HR,风险比,是两组患者瞬时死亡概率之比,是衡量干预效果最常用的参数。HR可近似计算为:
HR=对照组 mOS / 试验组 mOS
除此之外该类参数还有死亡风险(Hazard Rate),死亡率(Mortality,如5年死亡率),生存率(Proportion Surviving)。这些参数都可以进行相互换算,例如在生存数据满足指数分布假设下,试验组与对照组的
5. I型错误α和II型错误β,与其他样本量计算意义相同,不再赘述。
三、PASS软件操作
本文以mOS为例,介绍PASS的操作,如读者可以知晓其他参数,可以按照公式进行推算,或者直接选用PASS中相应模块进行计算。
在计算样本量之前,我们需要确定以下参数的取值:假设某研究的对照组mOS=6月,试验组mOS=8月(HR=0.75,可以由HR反推试验组的mOS);研究的入组时间预计为T1=10月;随访时间计划为T2=12月;试验组对照组比例1:1;取α=0.05(双侧);β=0.1。
1. 选择Survival-Logrank-Lakatos检验模块
Lakatos算法对数据分布无任何要求,也不要求HR恒定,一般选择该法。
然后选择Median Survival Time对应的子模块。
2. 填写参数
(1) Solve For:选择样本量N
(2) Power:1-β=1-0.1=0.9
(3) Alpha:0.05
(4) Proportion in Control Group:试验组与对照组比例为1:1,故对照组比例为0.5
(5) T1:对照组mOS=6
(6) T2:试验组mOS=8
(7) Accrual Time:入组时间=10(单位要和mOS一致)
(8) Accrual Pattern:入组模式,即入组速度是匀速还是其他。默认为匀速,如果是其他模式,点击右侧按钮 ,在C1-C10中输入各月入组速度的相对比例。
(9) Total Time:试验总时间=入组时间+随访时间=22
(10) Control Lost:对照组脱落率假设5%, Treatment Lost:试验组脱落率也假设为5%
(11) 点击左上角Run
四、结果解读
结果有两个,首先给出的是样本量,即两组各需要421名患者,总样本量842。
然后给出的是试验所需的死亡事件数,即该试验需要509例死亡事件。
注:①决定试验Power的实际上死亡事件数而不是样本量本身,死亡事件数由α、β和HR三者决定。样本量是通过需要的死亡事件数、两组的死亡概率和试验持续时间推算出来的。试验持续时间越长,获得同样的死亡事件数量所需的样本量就会越小,有兴趣的小伙伴可以延长随访时间加以验证。其他参数对样本量的影响涉及复杂的样本量计算过程,在此不做详述。
②PASS中参数不能直接填写入组速度。有时入组速度是受现实情况影响较大的因素,本例中入组速度需要84.2/月,研究者需要估计试验能否达到这样的水平,如果高于此水平,可以缩短入组时间,如果低于此水平则必须延长入组时间,然后重新计算样本量。
五、撰写结论
本研究采用Logrank法比较两组患者生存期时间的差异。预计对照组患者mOS为6个月,试验组患者mOS可延长至8个月(相应HR=0.75),试验需要842名患者(两组分别421名)才能在α=0.05(双侧)的显著水平下获得90%的把握度检测到此差异。试验计划入组10个月,随访12个月,在发生510例死亡事件时进行最终分析。估计试验组和对照组患者脱落率均为5%。
六、延伸阅读
1. 生存分析的方法
生存分析主要涉及到三种方法:
1) 非参数法:Logrank检验等
2) 半参数法:Cox回归分析
3) 参数法:生存数据服从特定分布如指数分布、weibull分布时采用的分析方法。
非参数检验对数据分布的要求较低,因此结果更加可信,一般肿瘤试验主要结局的分析都要基于非参数检验法。非参数检验法又分Logrank检验,Wilcoxon检验等,区别在于对死亡事件的早晚有不同的权重。Logrank检验对晚期死亡事件权重较大,而Wilcoxon检验等对早期死亡事件权重更大。一般肿瘤治疗药物临床试验会采用Logrank检验法。
非参数法主要用于比较两组生存曲线是否存在差异,回答“是否有效”的问题,但无法衡量效果大小。我们希望能够获得一个指标更直观地测量治疗效果,通常会采用HR,而HR要通过Cox回归才能获得,因此临床试验中也要用到Cox回归计算干预措施的HR,但用Logrank检验的P值作为试验主要结局是否阳性的依据。另外,在次要结局和探索性分析中,往往会采用Cox回归进行分析。
参数法对数据分布的要求较高,它假定数据服从一定的分布,一般不采用。
临床试验中样本量的计算要基于主要结局的分析,因此多基于Logrank法。
2. 干预效果参数的估计方法
样本量计算中对参数的估计主要是对干预效果的估计。临床常用的干预效果参数主要有mOS和t年死亡率(或生存率),因为这两组参数最直观也最容易理解。有了两组的mOS或t年死亡率(生存率)就可以推算出其他所有参数,例如HR。本文以mOS为例介绍估计该参数的几种方法,供读者参考,t年死亡率(生存率)估计方法相同。
一般对照组采用的治疗多为标准疗法或安慰剂,这些治疗方法的mOS数据可以参考其他临床试验的结果,而且可参考的试验数量一般较多,如果没有,可参考试验组mOS的估计方法。
试验组的mOS相对难以估计。因为既然是试验组,通常该治疗方案研究比较少,可直接参考的同类研究更少,如果没有,一般可借助于以下几种间接方法:
1) 参考前期试验数据。在药物研究过程中,一般会有前期小规模试验的数据,可以对其效果进行参考。如果前期试验使用的结局也是OS,可以直接参考,如果是ORR,DCR,PFS等数据,可以对比其他药物的前期试验这些指标的数据,如果表现更好,那么有理由相信OS也会比该药物OS要好。需注意,前期试验的样本量一般较小,另外ORR、DCR、PFS等指标与OS的相关性未必很强,因此不能完全相信前期试验结果。
2) 参考无对照研究。在临床研究中,临床大夫经常会把科里接受过该治疗的患者的治疗情况进行汇总发表。这些研究一般没有对照组,样本量也不够大,甚至很多是回顾性的研究。对于这样的研究,应该尽可能多的找到,比对结果,可以利用Meta分析的方法求得其合并值用于参考。
3) 参考其他干预措施的效果。可以将待研究的干预措施机理与其他干预措施机理进行比较,然后根据其他干预措施既有的大型试验结果反推。例如,国外一新型抗癌药已经上市,其患者mOS为11个月,而待评价的干预措施机理上不太可能优于该新药,因此估计其mOS小于11个月相对是合理的。
4) 由HR反推。有时研究者会发现一些研究仅给出了HR的参考,那么可以依据上文公式反推试验组mOS。
5) 研究者的信心和可用资源。所有的估计都只能给出一个大概的范围,不可能得到精确的结果。但是参考的途径多了,估计的范围会逐渐缩窄。最终估计值的确定,不可避免受到主观猜测(基于临床经验)以及可用资源的影响,这正是临床试验的风险所在,不可回避。
值得注意的是,在找到参考试验的时候,不能轻易将结果拿来使用。要仔细分析该试验的人群、干预方法与自己试验是否有较大差异,以及会产生怎样的差异。例如,ECOG评分是影响肿瘤患者预后的非常重要的因素,ECOG=0的患者比例越大,患者的mOS就会越长,如果自己试验的患者ECOG=0的患者比例可能要多一些,那么mOS就可能会长一些。参考国外试验时,尤其要考虑人种差异和用药方案的差异,例如某些重要基因突变的比例是否和国内患者一样,肿瘤病理亚型以及PD后用药是否一样等。
总之,干预效果的估计通常是非常困难的,它需要研究者具备较高的专业能力和科研水平。
(来源:“医咖会”微信公众号)