在放射医学、超声医学、实验室医学等临床医学活动中,经常会遇到评价两种或多种检测、测量方法结果一致性(agreement)的问题。一般情况下,其中一种方法是目前广泛应用的或被称为“金标准”的方法,而另一种方法则是更先进、更便于应用、更经济、无创或微创的方法。通过对两种测量方法进行一致性评价可以回答“这两种方法能否互相替代”这样的问题。本文通过实例介绍用于评价测量结果为连续资料的两种测量方法一致性的Bland—Altman分析。Bland—Altman分析最初是由Bland JM和AltmanDG于1986年提出的。它的基本思想是计算出两种测量结果的一致性界限(1imits of agreement),并用图形的方法直观地反映这个一致性界限。最后结合临床实际,得出两种测量方法是否具有一致性的结论。在进行两种方法的测定时,通常是对同一批受试对象同时进行测量。这两种方法一般不会获得完全相同的结果,总是存在着有一定趋势的差异,如一种方法的测量结果经常大于(或小于)另一种方法的结果,这种差异被称为偏倚(bias)。偏倚可以用两种方法测定结果的差值的均数d进行估计,d的变异情况则用差值的标准差Sd来描述。如果差值的分布服从正态分布,则95%的差值应该位于d一1.96Sd和五d+1.96Sd之间。我们称这个区间为95%的一致性界限,绝大多数差值都位于该区间内。如果两种测量结果的差异位于一致性界限内在临床上是可以接受的,则可以认为这两种方法具有较好的一致性,这两种方法可以互换使用。如果两种测量方法中没有一种是“金标准”,或者不能确定哪种方法一定反映真实值,则可以用两种测量结果的平均值作为最终测量结果。Bland-A1tman图以图形的方式反映一致性界限。在二维直角坐标中,用横轴z表示两种方法测量每个对象的平均值,纵轴Ⅳ表示两种方法测量每个对象的差值,即可得到Bland—Altman图:
图中上下两条水平实线代表95%一致性界限的上下限,中间实线代表差值的均数。两种测量方法的一致程度越高,代表差值均数的实线越接近代表差值均数为0的虚线。根据95%一致性界限外的数据点数和一致性界限内的最大差值,以及临床上的可接受程度,对待评价的两种方法的一致性做出评价。在临床实际应用中,除了用两种测量结果的差值反映一致性外,还可以用两种测量结果的比值来反映一致性。这时得到的是两种测量结果之间的比例关系。在求一致性界限时,先计算两种方法测量结果的比值,然后根据这些比值的均数和标准差计算一致性界限。在测量16名检查者心功能指标左心室舒张末期容量(EDV)时,分别用多次屏气电影法MRI(mEDv)和单次屏气电影法MRI(sEDV)进行测量,数据如下:
用差值进行Bland.Altman分析
16例配对数据差值的均数i=一3.16 ml,差值的标准差Sd=14.35 ml,则95%一致性界限为一3.16±1.96×14.35ml,即(一31.3ml,24.53rra),Bland一altman图如下图所示:
从图中可以看出,6.25%(1/16)的点在95%一致性界限以外;在一致性界限范围内,单次屏气电影法测得的EDV值(sEDV)与多次屏气电影法测得的EDV值(mEDV)相比,差值的绝对值最大为23.21 ml(图中实心圆圈代表的点)。由于两种方法测量结果最多相差23.21 m1,两种方法测量结果平均为115.99 m1,这种相差的幅度在临床上可以接受,因此可以认为两种方法测量的结果具有较好的一致性,两种方法在临床上可以互相代替使用。
用比值进行Bland.Ahman分析
如果在计算一致性界限时不是用测量结果的差值,而是用测量结果的比值,则计算得比值的均数=0.98,比值的标准差S=0.125,则95%一致性界限为0.98±1.96×0.125,即(0.73,1.22)。将两种方法测量值的比值作为纵坐标,则得到下图所示的Bland-Altman图:
从上图可以看出,13.5%(2/16)的点在95%一致性界限以外;在一致性界限范围内,比值的最大值为1.08,最小值为0.83(图中实心圆圈代表的点)。也就是说单次屏气法的测量值是多次屏气法测量值的0.83到1.08倍,即对于大多数受检者,单次屏气法的测量结果与多次屏气法测量结果相差8%到17%。从临床上考虑,这种差异是可接受的,因此这两种方法具有较好的一致性。
(参考文献:Bland-Altman分析在临床测量方法一致性评价中的应用)