新英格兰医学杂志论文的标配:高水平临床研究的基本特征

长青藤医学编辑

专业英语医学论文

作者:张科宏
制版:Freda

《白话医学研究》 


2020.11.24

今天,我们继续用新英格兰医学杂志2020年8月6日发表的一篇论文来讨论牛刊论文的“标配-标准配置”。

我们先简单复习一下论文的基本内容:

论文标题:

Subcutaneous or Transvenous Defibrillator Therapy

( DOI: 10.1056/NEJMoa1915932)

这是一个临床试验,研究对象是849名准备装植入式除颤器(ICD)的患者,这些患者按照1:1的比例被随机分成两组,其中一组接受经典的经静脉ICD(经静脉即除颤器机器本身还是放在皮下,但是机器里面有金属导线出来经过静脉进入心脏,用金属导线把电流送到心脏),另外一组接受全皮下ICD(全皮下即机器里面没有金属导线出来,电流直接从埋在皮下的机器里出来除颤)。

这个临床试验试图解答的问题是:全皮下ICD会出现的问题,包括ICD相关并发症和不当点击(即不该通电除颤的情况下发生电击)是否不高于经静脉ICD。这个研究基本设计是non-inferiority trial 非劣试验。

今天我们抓取散落在论文各个部分中的一些关键点,向大家解释高水平临床研究的基本特征。

论文方法部分第三个小节 Randomization。

第一句话:

Eligible patients were randomly assigned in a 1:1 ratio to receive either a subcutaneous ICD or transvenous ICD, with stratification according to center.

这句话里有两个讲究:

第一个讲究,只讲随机比例,不讲具体人数。

很多人写论文,会在这里写成:多少个病人、具体的数字、被随机分成两组。

这是错误的:随机入组了多少个病人,应当在论文的结果部分交代。

原因很简单:方法是试验开始之前就确定的东西,临床试验入组多少个病人,事先需要用效能分析进行估算;不过,只是估算而已。实际上入组了多少病人,试验完成才水落石出,因此,属于结果,不属于方法。

可能有人会说,你也太吹毛求疵了,我写了就行呗,写在哪里无所谓。

错误!两个原因:

1、如果写错地方了,懂行的人可能会认为你不懂行;

2、别人读你的论文,寻找关键信息很麻烦。

论文是给别人看的,作者给读者设置障碍,读者(包括杂志主编和审稿人)就不愿意看,也不会给你好脸。

第二个讲究:“stratification according to center-随机按中心分层”按中心进行分层随机,是多中心临床试验的标配。

原因是这样的:多中心临床试验有很多优势,包括更好的代表性,更强的普适性,因此,适用范围更广、价值更大。但是,多中心设计也会带来一系列问题。

举个例子:

微创手术治疗胃癌和开腹手术对比疗效,判定疗效的具体指标是肿瘤复发。

在这个研究中有一个关键的混杂因素:手术医生水平和整体治疗水平。

如果不按中心对随机进行分层,假设研究结果出来微创手术患者预后更好,但是同时发现微创和开腹手术在各家中心不均衡,像中山、华山这些医院微创手术比开腹更多,水平比较低的医院开腹手术更多,研究结果的解读就会出现重大的障碍:接受微创手术的患者预后更好,背后的原因完全可以是:微创手术更多是大牛医院和大牛医生做的,而不是微创本身的优势。所以,如果没有特殊的原因,多中心试验应当优先考虑按中心对随机进行分层。

下面我们直接看论文方法部分第5小节 Endpoints 终点。总共两段文字,我们来看第一段。

第一句话:

The composite primary end point of the trial consisted of device-related complications and inappropriate shocks.

试验一级终点是包含装置相关并发症和不当点击的复合终点,紧接着几句话对装置相关并发症和不当点击给出了明确的定义,并罗列了次要终点指标,这些内容我们暂且略过。

第二句话:

Shock therapy and other arrhythmic events that were derived from regular device interrogation were classified as being either appropriate or inappropriate according to the rhythm that initiated the therapy.

第三句话:

Hence, shocks without electrograms were not adjudicated.

这两句话描述不当电击的评价依据。

论文方法部分最后一个小节 Statistical analysis 统计分析。总共3段文字。

第一段描述样本量计算:

The trial was designed to test the hypothesis of noninferiority of the subcutaneous ICD as compared with the transvenous ICD with respect to the time from device implantation to the first occurrence of a primary end-point event.

告诉读者:这是一个非劣设计的临床试验,对照是什么,一级终点(即对比的核心)是什么。

第二句话:

The noninferiority margin for the upper boundary of the 95% confidence interval for the hazard ratio was set at 1.45.

说明非劣的标准是风险比95%置信区间的上限不超过1.45。

第三、第四句话交代样本量估算采用的假设:

The estimation of cumulative incidence and sample-size justification have been reported previously. We estimated that the occurrence of a primary end-point event in the transvenous ICD group would be 17.2% at 48 months. (1,11)

核心的假设是对照组48个月一级终点时间发生比例17.2%,给出明确的索引文献支持这个比例,一篇新英格兰医学杂志(1. Bardy GH, Lee KL, Mark DB, et al. Amiodarone or an implantable cardio-verter–defibrillator for congestive heart failure. N Engl J Med 2005; 352: 225-37.),一篇美国心脏病学学院杂志JACC的论文(11. Wilkoff BL, Williamson BD, Stern RS, et al. Strategic programming of detection and therapy parameters in implantable cardioverter-defibrillators reduces shocks in primary prevention patients: results from the PREPARE (Primary Prevention Parameters Evaluation) study. J Am Coll Cardiol 2008; 52: 541-50.),都是原始论文。

第五句话:

Assuming that 5% of patients would discontinue the trial, we calculated that the enrollment of 425 patients in each group would provide the trial with 85% power to show non-inferiority of the subcutaneous ICD at a one-sided alpha level of 0.025.

这句话的关键看点在 one-sided alpha level of 0.025 alpha 设在0.025,大多数的临床试验alpha 设在0.05(即 p<0.05)。这篇论文不同, alpha 设在0.025。

原因:大多数的临床试验对比的目的是看有没有差别,而差别是双向的,非劣研究的对比是单向的:我不比你差,因此, alpha 设在一半(0.025),就是这个道理。

第六句话:

A superiority analysis was prespecified if noninferiority was established.

非劣如果成立,预先设定了一个优效分析,去看全皮下ICD是否更好。这是一个布局,非常重要:非劣检验如果成立,紧接着下一个问题就是:仅仅是不更差、还是更好?

解决这个问题,就需要优效检验。从统计学角度出发,如果没有事先的设定,优效检验是一个posthoc analysis-事后检验,与事先设定的检验相比,可信度和说服力都更差。作者事先设定了这个检验,有远见,值得大家学习。

总结:

临床研究有很多的规矩,相当于标准配置。这些标配,我们平时阅读文献时如果能够留意学习,用到自己的研究当中,论文就更有说服力,至少看起来更加像样一点。

欢迎大家在下面留言讨论~

(0)

相关推荐