新英格兰医学杂志论文的标配:讨论部分的写作套路
长青藤医学编辑
专业英语医学论文
前面两期内容,我们用新英格兰医学杂志近期发表的一篇论文作为案例,学习了高质量论文的“标准配置”。
今天我们继续用这篇论文作为案例,学习论文写作的另一个重要的部分,就是讨论部分写作的基本规则/套路。
论文的讨论-Discussion是论文最难写的部分。说难写,是因为很多人不知道该写点什么。其实,论文的讨论部分是有基本套路的,如果我们掌握了这样基本的套路,写作起来其实并不难。
我们先简单回顾一下论文的基本内容:
论文标题:
Subcutaneous or Transvenous Defibrillator Therapy
( DOI: 10.1056/NEJMoa1915932)
这是一个临床试验,研究对象是849名准备装植入式除颤器(ICD)的患者,这些患者按照1:1的比例被随机分成两组,其中一组接受经典的经静脉ICD(经静脉即除颤器机器本身还是放在皮下,但是机器里面有金属导线出来经过静脉进入心脏,用金属导线把电流送到心脏),另外一组接受全皮下ICD(全皮下即机器里面没有金属导线出来,电流直接从埋在皮下的机器里出来除颤)。
核心结果:
中位随访时间49.1个月,一级终点,装置相关并发症(device-related complications)和不当电击(inappropriate shocks)(即不该除颤的情况下除颤)加在一起,一级终点在对照组发生比例15.7%,全皮下ICD组15.1%,风险比0.99,95%置信区间0.71-1.39,非劣检验成立,p<0.01。
下面我们看作者如何展开讨论。
这篇论文的讨论部分总共七段。
第一段,共3句话
第一段,共3句话。
第一句话:
In this trial, we found that the subcutaneous ICD was noninferior to the transvenous ICD with respect to device-related complications or inappropriate shocks in patients with an indication for defibrillator therapy but with no indication for pacing.
第二句话:
The results were consistent in several sensitivity analyses and subgroup analyses.
第三句话:
We observed equal numbers of sudden cardiac deaths in the two groups, but there were numerically more deaths from other causes in the subcutaneous ICD group than in the transvenous ICD group.
这3句话是对研究结果的高度凝练。
所有原始研究论文的讨论部分都应当、也必须这么开头,都应当是对研究结果的总结。
这是规矩,或者说是潜规则,是读者期望看到的,任何其他的内容都不应当出现在这里。
第二段,共2句话
第二段,共2句话。
第一句话:
With respect to the two components of the primary outcome, there was a higher cumulative incidence of device-related complications in the transvenous ICD group and a higher cumulative incidence of inappropriate shocks in the subcutaneous ICD group, although the trial was not powered for these comparisons.
这句话开始对研究结果进行更加细致的描述,具体是一级终点的2个组成部分:装置相关并发症和不当电击。前者,装置相关并发症在对照组(即经静脉ICD组)更高;后者,不当电击,在皮下ICD组更高。
句子结尾“although the trial was not powered for these comparisons” 很重要。
第一,说明试验设计不是根据这2个指标分别去进行的,因此关于这2个具体指标的结论不够确实,只能看做一个初步结果,
第二,也是更加重要的,用语言技巧表明态度:虽然统计学上不能完全成立,但我(作者)相信:皮下ICD组在装置相关并发症上有优势,在不当电击方面有待提高。
第二句话:
Perspectives may vary among physicians and patients about which component poses a heavier burden: whereas complications are associated primarily with physical distress, ICD shocks can have profound psychological implications.
并发症和不当电击在2个组别的结果是反的,一个更高,另外一个更低,因此有必要再看讨论2件事情的后果。
这句话讲的就是这件事情:装置相关并发症导致的主要是对身体的伤害,而不当电击的伤害主要是心理的,太吓人了。
第三段,共4句话
第三段,共4句话。
第一句:
The overall incidence of complications in this trial was as anticipated and was similar to that in previous studies.
本研究中,并发症的发生率和既往研究的报道相似。
前面2段基本上是在总结研究结果,真正的讨论从这句话开始。
第一件需要讨论的事情必须是:
这个研究和前人/他人的研究相比,自己的研究中主要终点指标是否一致。
原因非常简单,如果差别很大,大致有下面几种情况:
1、你的研究不靠谱,你对终点指标的观测方法有问题,你的研究结果就不可信。
2、你的研究对象,和前人/他人的研究对象有重大差异,你的研究结果本身是可信的,但是用在别人那里可能不见得好使。
3、你的研究更加靠谱。
这里给大家举个例子:
开车超速问题,假设以前别人做研究,判断是否超速,是通过目测;如果你研究出搞出一套雷达系统测速,方法会更加客观和敏感。这样的情况,你得到的结果-超速的比例,和既往研究不同就更加可信了。
具体怎么回事儿,作者必须在讨论部分说明白。
第二句:
Fewer lead-related complications (including infection, perforation, lead dislodgement, and lead dysfunction) and subsequent surgical reinterventions occurred in the subcutaneous ICD group than in the transvenous ICD group, but this effect was counterbalanced by more frequent pocket hematomas with the subcutaneous ICD.
第三句:
The use of general anesthesia and defibrillation testing was much greater with the subcutaneous ICD than with the transvenous ICD.
第四句:
Longer-term follow-up of this cohort will be important because the incidence of lead-related complications increases over time with the transvenous ICD and because battery longevity is a limiting factor for the subcutaneous ICD.
这几句话,是对装置并发症的混杂因素进行更加深入细致的展开。
第四段,共6句话
第四段,共6句话。
第一句话:
Patients with a subcutaneous ICD had a higher risk of inappropriate shock than anticipated; the shocks were most frequently precipitated by oversensing of cardiac signals (predominantly T waves) and noncardiac signals.
下面的5句话以及第五段,都是对这个结果的临床意义进行更加深入的解读。
由于时间的限制,我们这里略过、不一一展开研读了。
第六段,共9句话
第六段,共9句话。
第一句话:
This trial has several limitations.
第二句话:
First, the members of the clinical-events committee were aware of the trial-group assignments.
第三句话:
Second, device technology evolved throughout the trial, and practitioners who performed the implantations had less experience with the subcutaneous ICD than with the transvenous ICD, which could have affected clinical outcomes.
第四句话:
Third, screening data were incomplete, and thus selection bias could not be ruled out.
这几句话讲了三件事情。
大家可以看到,作者讨论的这3个局限性,都是非常具体而且对研究结果有重大影响的东西,不是虚拟的、公式化的东西。
那什么是虚拟的、公式化的局限性呢?
给大家举个例子:
作者做一个回顾性病例对照研究,对比两种冠状动脉支架,论文讨论部分关于局限性:First, this is a retrospective case-control study. Accordingly, the results are subjected to inherent bias.
这就废话:既然读者看到了这里,自然知道这是一个回顾性的病例对照研究;人家审稿人有资格审这篇稿件,自然知道这样的研究有天生的缺陷:偏倚。
这话本身没错,但必须有下文跟着具体解读,否则这就是一句正确的废话。
作者应当讨论的是:在这个特定的研究中,具体的偏倚可能来自什么地方?
不能仅仅只说这个是病例对照,有偏移要告诉别人偏移来自什么地方,是病例、对照的基线特征?年龄不同?性别有差异?冠脉病变范围和狭窄程度有差异?这些都必须要解释,这些差异进一步对你的研究核心结果一级终点有什么样的具体影响?
举个更加确切的例子:
假设这个回顾性研究显示,A支架患者预后更好,接受A支架的病人病变范围比B支架对照更加广泛,狭窄程度更加严重,这样的情况是不是有偏移?这种偏移恰恰更加说明A支架比B支架好;假设接受A支架的病人病变范围比B支架对照更小,狭窄程度没有很严重,那就可能动摇“A支架更好”这个结论。
第五句话:
Fourth, 27 patients were excluded before device implantation, 38 patients were lost to follow-up, and 126 patients died before having a primary end-point event.
第六句话:
However, sensitivity analyses yielded consistent results.
前一句话讲局限性本身 ,后一句话讲我知道这个局限性,自己做了补救工作(敏感性分析),结果支持主分析。
第七句话:
Fifth, it is debatable whether the magnitude of the possible between-group difference as reflected by the noninferiority margin is clinically acceptable.
这句话是所有的非劣临床试验中必须要讨论的部分,非劣标准的设计,在这个研究中具体是:接受皮下ICD的患者中,并发症和不当电击发生率的95%上限,不超过经静脉ICD对照的145%,这就算非劣。
举个例子,
对照组并发症和不当电击发生率是20%,皮下ICD发生率的95%置信区间上限只要低于20%+20%×0.45=29%,就算非劣成立。
这样一个标准是否能被大家接受?这是一个问题。
听到这里,有人会说,早知如此何必当初,在设定标准时更严一点(比如,不超过30%而不是45%),不就得了么?
当然可以了,但是用更加严格的非劣标准,试验失败的可能性就会更高。
何去何从,需要平衡,这也和研究者的性格有关。野心大、赌博心重的人可能会偏向于选择更加严格的标准,喜欢小打小闹、有点成果就容易满足的人,可能会偏向更加宽松的标准。
我们再回到论文,非劣试验的非劣标准是否合适,论文讨论中必须要有。没有的话这个研究就很难成立。
第八句话:
Finally, the median follow-up of 48 months was too limited to provide information on chronic complications.
第九句话:
Long term follow up is therefore warranted and is ongoing.
第七段
第七段:
The results of our trial showed that among patients with an indication for ICD therapy but not for pacing therapy, the subcutaneous ICD was noninferior to the transvenous ICD with respect to the cumulative incidence of the primary end point of device-related complications or inappropriate shocks.
这句话是对研究核心结论的表述,讲的非常确切,文章到此结束。
总结
总结:
论文讨论部分的写作,有三个基本点:
1、讨论的核心是研究结果,所有东西围绕的是你的结果,讨论这个结果是否可信,样本是否有足够的代表性;
2、局限性必须充分展开,不能遮遮掩掩、支支吾吾。必须勇敢地面对自己的缺陷/自我批评,不能把审稿人当成傻子;
3、必须要有写作的大纲,从宏观层面上进行整体布局。具体怎么布局,上面展现给大家的内容,已经是高度凝练的内容了,这里就不再啰嗦。