一文带你玩转森林图!
提到森林图,相信大家一定不会感到陌生,在Meta分析中,森林图可以说是必不可少,它用一种非常形象的图形方式,简单直观的展示了Meta分析的统计汇总结果,受到了研究者的欢迎。那么,除了在Meta分析中,森林图还能用在什么地方呢,今天我们的话题就从森林图开始说起。
认识森林图
森林图(forest plot),从定义上讲,它一般是在平面直角坐标系中,以一条垂直于X轴的无效线(通常坐标X=1或0)为中心,用若干条平行于X轴的线段,来表示每个研究的效应量大小及其95%可信区间,并用一个棱形来表示多个研究合并的效应量及可信区间,它是Meta分析中最常用的结果综合表达形式。
我们先来看一篇2017年发表在Lancet杂志的一篇Meta分析《Optimal timing of an invasive strategy in patients with non-ST-elevation acute coronary syndrome: a meta-analysis of randomised trials》,以这篇文章为例来带领大家认识一下森林图中各个图形的含义。
解读森林图
我们在认识了解森林图每个图形的含义后,下面向大家介绍一下如何解读森林图的临床意义。通常森林图有两种类型,一类是二分类变量森林图,一类是连续变量森林图。
1. 二分类变量森林图
上面的例子给大家展示的就是最为经典的二分类变量森林图,在这类研究中,常用相对危险度(RR)、比值比(OR)或风险比(HR)来作为表示研究因素效应量大小的指标。通常情况下,在森林图中以效应量点估计值=1作为无效线,假定无效线左侧为因素A(作为参照),无效线右侧为因素B。
当效应量的95% CI包含1时,即森林图中的横线线段与无效线相交时,提示两组之间结局事件发生率的差异无统计学显著性,不能认为因素A、B对结局事件发生风险的影响作用不同。
当效应量的95% CI均大于1时,即森林图中的横线线段与无效线不相交,且在无效线右侧,可认为因素B组的结局事件发生率大于因素A组。一般情况下,若结局事件为发病、死亡等不良事件时,则提示与因素A相比,因素B可增加结局事件的发生率,为危险因素。
反之,当效应量的95% CI均小于1时,即森林图中的横线线段与无效线不相交,且在无效线左侧,可认为因素B组的结局事件发生率小于因素A组。一般情况下,若结局事件为发病、死亡等不良事件时,则提示与因素A相比,因素B可减少事件的发生率,为保护因素。
2. 连续变量森林图
当研究的分析指标为连续变量时,此时可绘制连续变量森林图,在这类研究中,通常用加权均数差(Weighted Mean Difference,WMD)或者标准化均数差(Standardised Mean Difference,SMD)作为合并的统计量。
加权均数差(WMD),在Meta分析中,它主要用于具有相同连续性结局变量和相同测量单位的研究中。计算WMD时,每个原始研究的WMD为两组均数的差值,即试验组的均数减去对照组的均数。WMD以各个研究中原始的测量单位,真实地反映了研究效果,消除了绝对值大小对结果的影响。一般的,当不同研究的测量方法和测量单位相同时,宜选用WMD作为效应量,在实际的应用中更容易理解。
标准化均数差(SMD),由两组均数差值除以平均标准差计算而得,当不同研究的测量方法和测量单位不同,或者不同研究间均数的差异过大时,宜选用SMD作为效应量。SMD不仅消除了绝对值大小的影响,还消除了测量单位对结果的影响,是一个相对指标,结果的一致性优于WMD。但是在某些情况下,相对指标并不能反映结局事件的真实情况,容易夸大效应,结果的可解释性要弱于WMD,因此对于结果的解释要慎重。
当效应量=0时提示两组均数相等,因此通常在森林图中以效应量点估计值=0作为无效线,我们依然假定无效线左侧为因素A(作为参照),无效线右侧为因素B。
当效应量的95% CI包含0时,即森林图中的横线线段与无效线相交时,可认为两组之间的均数差异无统计学显著性,不能认为两组结局指标的均数不相等。
当效应量的95% CI均大于0时,即森林图中的横线线段与无效线不相交,且在无效线右侧,可认为因素B组结局指标的均数大于因素A组。一般情况下,若结局指标是不利事件时,则提示与因素A相比,因素B可引起结局指标的升高,为危险因素。
反之,当效应量的95% CI均小于0时,即森林图中的横线线段与无效线不相交,且在无效线左侧,可认为因素B组结局指标的均数小于因素A组。一般情况下,若结局指标是不利事件时,则提示与因素A相比,因素B可引起结局指标的降低,为保护因素。
玩转森林图
当然,以上的内容我们都是基于在Meta分析的基础上,来对森林图的内容和意义进行的详细介绍,那么除了在Meta分析中,森林图还可以用在什么地方呢?
既然我们已经提到森林图可以直观的反映出效应量(例如RR、OR、HR或者WMD)大小及其95% CI,这些效应量指标通常都是通过采用多因素回归分析所得,因此我们同样可以把森林图借鉴过来,用于展示多因素回归分析的结果,从而使结果可视化,更加直观明了。
我们常会在文献中可以看到以下几种用于展示回归分析结果的森林图:
1. 亚组分析
将亚组分析的结果用森林图来表示最为常见,此类森林图和上面我们介绍的森林图的意义相似,主要是根据我们分组的一些因素,例如年龄、性别等,把研究分成了不同的亚组,然后在不同亚组下分别进行分析和探讨。这样不仅可以展现各个亚组内试验因素的效应量大小,同时还可以直观的在亚组之间进行比较。
可以参考2017年发表在Lancet Oncol杂志的一篇文章《First-line selective internal radiotherapy plus chemotherapy versus chemotherapy alone in patients with liver metastases from colorectal cancer》。
2. 趋势变化
例如Bone杂志在2013年发表的一篇文章《C-reactive protein and fracture risk: European Prospective Investigationinto Cancer Norfolk Study》,研究人员为了探讨CRP水平与骨折发生风险之间的关联性,将CRP水平按照临床相关的切点分为6组,分别分析对骨折发生风险的影响,并用森林图将分析结果展示出来,虽然文章中展示结果的时候采用的是翻转了90°的森林图,我们也可以认为是森林图的一种,其图形的含义是一致的。
我们在前期推送的文章《想将连续变量转化为哑变量纳入回归模型,咋分组?》中介绍过,可以将连续变量降维分组,这样做的好处是可以帮助我们挖掘数据中隐藏的一些变化关系。在本例中,作者将CRP水平分为6组,把每个水平分组下的回归分析结果通过森林图的形式进行表达,很清晰的展示出CRP水平与骨折发生风险之间存在一种明显的“U”型变化趋势,让读者一目了然。
3. 组间差异
前面已经提到,对于连续型变量也可以绘制森林图,用于表示组间的差异大小。可以参考2015年在JAMA杂志上发表的一篇文章《Rehabilitation After Immobilization for Ankle Fracture:The EXACT Randomized Clinical Trial》,意义就不在这里赘述了。
从Meta分析到回归分析,各种各样的森林图,目的还是为了能够可视化的展示我们的分析结果,使结果更加简单直观,让读者一目了然,在文章中放一张森林图,也一定会让自己的文章增色不少。那么如何绘制一张高质量的森林图呢,目前有很多软件都支持绘制漂亮的森林图,我们将在下期内容中向大家进行一一介绍,相信终有一款适合你。
参考文献:
[1] Lancet. 2017 Aug 19;390(10096):737-746
[2] Lancet Oncol. 2017 Sep;18(9):1159-1171
[3] Bone. 2013 Sep;56(1):67-72
[4] JAMA 2015 Oct 06;314(13):1376-85
(想要及时获得更多内容可关注“医咖会”微信公众号和网站http://www.mediecogroup.com/:传播研究进展,探讨临床研究设计与医学统计学方法)