样本量计算-事件驱动试验设计

长青藤医学编辑

专业英语医学论文

作者:张科宏

编辑:Freda

《白话医学研究》 

2019.10.08

该视频已被发布者删除

随机对照临床试验,样本量的估算非常重要:估计不足,过于乐观,试验失败是可以预见的结果;估计过于保守,样本量太大,或者难以完成研究,或者是投入过多的精力。

样本量的具体计算,需要做一系列的假设:

1、alpha,约定俗成是0.05;

2、1-beta,通常是在0.8到0.9;

3、一级终点在两个组别里的差别,例如,某个时间段内疾病复发的比例,在对照和干预两个组别中的比例分别是多少?再考虑脱组等因素,最后得出结果,每个组别需要入组多少病人?

那么问题来了:如果对一级终点事件在两组间的比例假设错误,算出来的样本量必然是不合理的。

新英格兰医学杂志2019年4月14日发表一篇论文,对此给出了解决方案。

论文标题:

Canagliflozin and Renal Outcomes in Type 2 Diabetes and Nephropathy

2型糖尿病和肾病患者中卡格列净治疗和肾脏预后

(DOI: 10.1056/NEJMoa1811744)

这是一个随机对照临床试验,2型糖尿病并蛋白尿慢性肾病患者被随机分配到两个组别,在降压治疗的基础上分别接受卡格列净或者安慰剂。

一级终点在这个研究里面是一个复合指标,其中包括进展到终末期肾病、血肌酐翻倍以及肾脏或者心血管死亡。

关于样本量估算,论文正文方法部分的交代是:

The trial was designed to be event-driven, with the enrollment of at least 4200 patients (844 events) required to provide a power of 90% to detect a risk of the primary outcome that was 20% lower in the canagliflozin group than in the placebo group at an alpha level of 0.045 after adjustment for one interim analysis.

“The trial was designed to be event-driven-研究设计是事件驱动的”,具体的假设是:

1、alpha level of 0.045;

2、1-beta at 0.9;

3、研究一级终点在干预组比对照组低20%。

在这个假设下,研究结束的设定是在844个受试者上看到一级终点事件。

这样一个设计,很大程度上保证了研究的质量,原因非常简单:两个组别一级终点事件的统计对比,取决于分母,也就是两个组别入组了多少病人,更大程度上取决于分子,多少个病人发生了终点事件。

所以,聪明也是更加合理的样本量计算,应当更多地考虑终点事件,规定这个试验计划进行到多少病人出现了一级终点,而不是规定这个试验要入组多少个患者。

这句话里面,还有一个很重要的东西:“alpha level of 0.045”。

大家知道,alpha 小于0.05 是统计学的金标准。

这个试验中alpha 设置在 0.045 的原因是期中分析(interim analysis)。期中分析,也就是研究尚未完成,数据揭盲进行统计分析。

你这么做的原因,不能是性子太急,而必须是伦理考量,在以下两种可能出现的情况下及时停止试验:

1、试验药物有严重的、意料之外的不良反应;

2、研究做了一半,谁好谁坏就得到了无可争辩的结果。

从统计学角度出发,期中分析带来的问题是多重检验,假阳性可能性增加。因此,统计方案必须作出调整。alpha也就是p值,必须拆分到期中分析和“期末考试”里面。p值加起来等于0.05。

今天一定要努力工作绝对不会浪费时间

(0)

相关推荐