手把手教学：生存分析的样本量计算

2024-06-22 06:33:14

一、临床研究问题

生存分析研究在临床上非常常见，例如肿瘤科大夫想要评价两种治疗措施对于患者生存期的影响，或者肿瘤复发的影响，一般要用到生存分析。

一般肿瘤治疗药物的临床研究，都会采用Logrank检验比较主要结局。本文将介绍如何利用PASS软件计算生存分析Logrank检验的样本量。本文适用于无期中分析的试验设计类型。对于有期中分析的试验，样本量计算涉及到α消耗函数等调整假阳性率的方法，需要其他模块完成。

二、样本量计算所需参数

在介绍样本量计算之前，首先介绍几个参数的概念。

1. 中位生存时间mOS：即50%的患者死亡时所对应的时间。如果将所有患者生存时间按从小到大排序，中位生存时间即顺序处于中间的患者的生存时间。

2. 入组时间：入组患者很难瞬间完成，尤其对于发病率比较低的肿瘤，因此患者入组往往要经过相对较长的时间。入组时间为第1例患者入组到最后一例患者入组所经历的时间。

3. 随访时间：在最后一例患者入组完成后，还需对所有患者随访一段时间。从最后一例患者入组，到试验截止日期的间隔称为随访时间。注意，这里的随访时间，跟患者的观察时间意义不同。如果一个临床试验入组时间为6个月，随访时间为12个月，那么对于第一例入组的患者，其观察时间为6+12=18个月（尽管该患者可能在试验截止前就已死亡），而对于最后一例入组的患者，其观察时间为12个月，即各个患者观察时间不同。观察时间越长，观察到结局发生的可能性越大。

4. 效果参数：HR，风险比，是两组患者瞬时死亡概率之比，是衡量干预效果最常用的参数。HR可近似计算为：

HR=对照组 mOS / 试验组 mOS

除此之外该类参数还有死亡风险（Hazard Rate），死亡率（Mortality，如5年死亡率），生存率（Proportion Surviving）。这些参数都可以进行相互换算，例如在生存数据满足指数分布假设下，试验组与对照组的

5. I型错误α和II型错误β，与其他样本量计算意义相同，不再赘述。

三、PASS软件操作

本文以mOS为例，介绍PASS的操作，如读者可以知晓其他参数，可以按照公式进行推算，或者直接选用PASS中相应模块进行计算。

在计算样本量之前，我们需要确定以下参数的取值：假设某研究的对照组mOS=6月，试验组mOS=8月（HR=0.75，可以由HR反推试验组的mOS）；研究的入组时间预计为T1=10月；随访时间计划为T2=12月；试验组对照组比例1:1；取α=0.05（双侧）；β=0.1。

1. 选择Survival-Logrank-Lakatos检验模块

Lakatos算法对数据分布无任何要求，也不要求HR恒定，一般选择该法。

然后选择Median Survival Time对应的子模块。

2. 填写参数

(1) Solve For：选择样本量N

(2) Power：1-β=1-0.1=0.9

(3) Alpha：0.05

(4) Proportion in Control Group：试验组与对照组比例为1:1，故对照组比例为0.5

(5) T1：对照组mOS=6

(6) T2：试验组mOS=8

(7) Accrual Time：入组时间=10（单位要和mOS一致）

(8) Accrual Pattern：入组模式，即入组速度是匀速还是其他。默认为匀速，如果是其他模式，点击右侧按钮，在C1-C10中输入各月入组速度的相对比例。

(9) Total Time：试验总时间=入组时间+随访时间=22

(10) Control Lost：对照组脱落率假设5%， Treatment Lost：试验组脱落率也假设为5%

(11) 点击左上角Run

四、结果解读

结果有两个，首先给出的是样本量，即两组各需要421名患者，总样本量842。

然后给出的是试验所需的死亡事件数，即该试验需要509例死亡事件。

注：①决定试验Power的实际上死亡事件数而不是样本量本身，死亡事件数由α、β和HR三者决定。样本量是通过需要的死亡事件数、两组的死亡概率和试验持续时间推算出来的。试验持续时间越长，获得同样的死亡事件数量所需的样本量就会越小，有兴趣的小伙伴可以延长随访时间加以验证。其他参数对样本量的影响涉及复杂的样本量计算过程，在此不做详述。

②PASS中参数不能直接填写入组速度。有时入组速度是受现实情况影响较大的因素，本例中入组速度需要84.2/月，研究者需要估计试验能否达到这样的水平，如果高于此水平，可以缩短入组时间，如果低于此水平则必须延长入组时间，然后重新计算样本量。

五、撰写结论

本研究采用Logrank法比较两组患者生存期时间的差异。预计对照组患者mOS为6个月，试验组患者mOS可延长至8个月（相应HR=0.75），试验需要842名患者（两组分别421名）才能在α=0.05（双侧）的显著水平下获得90%的把握度检测到此差异。试验计划入组10个月，随访12个月，在发生510例死亡事件时进行最终分析。估计试验组和对照组患者脱落率均为5%。

六、延伸阅读

1. 生存分析的方法

生存分析主要涉及到三种方法：

1) 非参数法：Logrank检验等

2) 半参数法：Cox回归分析

3) 参数法：生存数据服从特定分布如指数分布、weibull分布时采用的分析方法。

非参数检验对数据分布的要求较低，因此结果更加可信，一般肿瘤试验主要结局的分析都要基于非参数检验法。非参数检验法又分Logrank检验，Wilcoxon检验等，区别在于对死亡事件的早晚有不同的权重。Logrank检验对晚期死亡事件权重较大，而Wilcoxon检验等对早期死亡事件权重更大。一般肿瘤治疗药物临床试验会采用Logrank检验法。

非参数法主要用于比较两组生存曲线是否存在差异，回答“是否有效”的问题，但无法衡量效果大小。我们希望能够获得一个指标更直观地测量治疗效果，通常会采用HR，而HR要通过Cox回归才能获得，因此临床试验中也要用到Cox回归计算干预措施的HR，但用Logrank检验的P值作为试验主要结局是否阳性的依据。另外，在次要结局和探索性分析中，往往会采用Cox回归进行分析。

参数法对数据分布的要求较高，它假定数据服从一定的分布，一般不采用。

临床试验中样本量的计算要基于主要结局的分析，因此多基于Logrank法。

2. 干预效果参数的估计方法

样本量计算中对参数的估计主要是对干预效果的估计。临床常用的干预效果参数主要有mOS和t年死亡率（或生存率），因为这两组参数最直观也最容易理解。有了两组的mOS或t年死亡率（生存率）就可以推算出其他所有参数，例如HR。本文以mOS为例介绍估计该参数的几种方法，供读者参考，t年死亡率（生存率）估计方法相同。

一般对照组采用的治疗多为标准疗法或安慰剂，这些治疗方法的mOS数据可以参考其他临床试验的结果，而且可参考的试验数量一般较多，如果没有，可参考试验组mOS的估计方法。

试验组的mOS相对难以估计。因为既然是试验组，通常该治疗方案研究比较少，可直接参考的同类研究更少，如果没有，一般可借助于以下几种间接方法：

1) 参考前期试验数据。在药物研究过程中，一般会有前期小规模试验的数据，可以对其效果进行参考。如果前期试验使用的结局也是OS，可以直接参考，如果是ORR，DCR，PFS等数据，可以对比其他药物的前期试验这些指标的数据，如果表现更好，那么有理由相信OS也会比该药物OS要好。需注意，前期试验的样本量一般较小，另外ORR、DCR、PFS等指标与OS的相关性未必很强，因此不能完全相信前期试验结果。

2) 参考无对照研究。在临床研究中，临床大夫经常会把科里接受过该治疗的患者的治疗情况进行汇总发表。这些研究一般没有对照组，样本量也不够大，甚至很多是回顾性的研究。对于这样的研究，应该尽可能多的找到，比对结果，可以利用Meta分析的方法求得其合并值用于参考。

3) 参考其他干预措施的效果。可以将待研究的干预措施机理与其他干预措施机理进行比较，然后根据其他干预措施既有的大型试验结果反推。例如，国外一新型抗癌药已经上市，其患者mOS为11个月，而待评价的干预措施机理上不太可能优于该新药，因此估计其mOS小于11个月相对是合理的。

4) 由HR反推。有时研究者会发现一些研究仅给出了HR的参考，那么可以依据上文公式反推试验组mOS。

5) 研究者的信心和可用资源。所有的估计都只能给出一个大概的范围，不可能得到精确的结果。但是参考的途径多了，估计的范围会逐渐缩窄。最终估计值的确定，不可避免受到主观猜测（基于临床经验）以及可用资源的影响，这正是临床试验的风险所在，不可回避。

值得注意的是，在找到参考试验的时候，不能轻易将结果拿来使用。要仔细分析该试验的人群、干预方法与自己试验是否有较大差异，以及会产生怎样的差异。例如，ECOG评分是影响肿瘤患者预后的非常重要的因素，ECOG=0的患者比例越大，患者的mOS就会越长，如果自己试验的患者ECOG=0的患者比例可能要多一些，那么mOS就可能会长一些。参考国外试验时，尤其要考虑人种差异和用药方案的差异，例如某些重要基因突变的比例是否和国内患者一样，肿瘤病理亚型以及PD后用药是否一样等。

总之，干预效果的估计通常是非常困难的，它需要研究者具备较高的专业能力和科研水平。

（来源：“医咖会”微信公众号）

西地尼布联合化疗治疗复发性卵巢癌的3期试验结果如何？

西地尼布(Cediranib)是一种口服的抗血管生成的VEGF受体1-3抑制剂. 在一项随机试验中,西地尼布(20 mg/日)与以铂为基础的化疗相结合,作为维持治疗用于首次复发的"铂敏感型& ...
2020 ASCO 免疫双子星！三大双免方案攻陷肝胆肿瘤，疗效喜人！

前言 D+T组合,今年肝胆最闪耀的双星 1.一线治疗晚期肝癌,mOS达18.7个月该试验分析PD-L1单抗Durvaluamb(德瓦鲁单抗,I药)联合CTLA-4单抗tremelimumab(T药 ...
【医伴旅】胃癌潜在生物标志物可以从紫杉醇治疗中获益

来源:Pexels 研究人员通过机器分析一项大型胃癌试验的数据,发现了一种潜在的生物标志物,这种生物标志物可以从紫杉醇的治疗中获益. 新加坡杜克大学医学院的Pat patrick Tan博士和Ragh ...
中国瑰宝再创佳绩：联合仑伐替尼显著降低不良反应，延长生存

改善不良反应,保护肝功能中药也有大用处作为第二款一线治疗药物,仑伐替尼获批用于不可切除的肝细胞癌(HCC).但是仑伐替尼治疗总会出现包括高血压.蛋白尿.疲劳和厌食在内的不良反应,这可能迫使剂量减少 ...
ASCO GU2021：前列腺癌篇

森哥三连发 TITAN Final Analysis Ph3TITAN:阿帕他胺+雄激素剥夺治疗(ADT) vs 安慰剂+ADT用于mCSPC的最终分析 1052名mCSPC患者1∶1随机分入阿帕他胺 ...
【论著】平板运动试验在老年冠心病诊断中的应用价值

循心电踪迹,探心脏奥秘! 杂志君小芯,在此恭候! 作者:陈晓改作者单位:许昌医院心电图室左右都可以滑动打开心扉引用格式: 陈晓改. 平板运动试验在老年冠心病诊断中的应用价值[J]. 实用心电学 ...
【假装在Munich】01-IMpassion 130

也是我眼中的ESMO 2018上第一项重磅研究结果同日NEJM在线,所以基本参考文章来看. 内容 1 背景 2 方法 3 结果 3.1 患者及试验干预 3.2 无进展生存(PFS)分析 3.3 内部 ...
样本量计算教程：非劣效性试验+生存分析

医咖会之前推送过的"非劣效性试验的样本量计算"教程中,研究结局是连续变量或者分类变量,那如果是生存数据,又该如何计算样本量呢? 一.研究问题与数据某研究者拟开展一项非劣效的随机对 ...
生存分析中生存率的计算

近日连续遇到好几个同事在写临床研究论文时问及生存率的问题,有人还是对生存率的计算有点儿理不清楚,本期就这一问题作一讨论.当然这一讨论仅限于简单的临床研究数据中的Kaplan-Meier法.对于流行病学 ...
R语言生存分析: 时变竞争风险模型分析淋巴瘤患者

原文链接:http://tecdat.cn/?p=22422 在本文中,我们描述了灵活的竞争风险回归模型.回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率.该模型包含Fine和Gray(1 ...
【文献摘要】前庭神经鞘瘤的恶性转变:临床研究与生存分析

<Frontiers in Oncology>杂志 2021 年4月14日在线发表四川大学华西医院的Jiuhong Li, Qiguang Wang, Menglan Zhang,等撰写的 ...
生存分析，你真得了解吗？ |

在医学或者公共卫生研究中,慢性疾病的发生.发展.预后一般不适用于治愈率.病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗 ...
应该知道的生存分析参数（收藏贴）

在做生信分析的时候,尽管各种分析多到让人眼花缭乱,但是最重要的无外乎表达差异和生存参数,其余都是点缀.表达差异是前提,但是光有表达差异还不行.若A基因在肿瘤和正常组织中表达有差异,但是不影响生存参数, ...
资料分析要海量计算？国考行测绝对不能这么干！这么备考早上岸

<考试大纲>中对资料分析的介绍为:资料分析主要测查报考者对文字.数字.图表等统计性资料的综合理解与分析加工能力. 综合历年考情分析,考试具体知识点如下: (一)统计分析 2015-2021 ...
R语言生存分析可视化分析

完整原文链接:http://tecdat.cn/?p=5438 生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法. 生存分析被用于各种领域,例如: 癌症研究为患者生存时间分析, &qu ...
周末统计问题(4): 哪些因素会影响临床试验样本量计算？

<英国医学会杂志>(BMJ)自2008年9月开始至2015年由两位流行病与统计学专家不间断地出了300多期statistical question系列.在这个系列中,两位学者每次出一道统计 ...

手把手教学：生存分析的样本量计算

相关推荐