脑电图在中重度颅脑损伤患者预后中的预测价值
陈采霞 胡成欢 翻译 张丽娜 校对
摘要
背景:更好的预后预测有助于对创伤性脑损伤(TBI)的严重程度进行可靠的量化和分类,从而为临床决策提供支持。我们开发了一个结合定量脑电图(qEEG)测量和临床相关参数的多因素模型,来论证中到重度脑外伤患者预后预测的概念。
方法:在患者入住ICU的前7天进行连续脑电图测量。根据扩展格拉斯哥预后评分(GOSE)将患者12个月的预后分为差(GOSE 1-2)和好(GOSE 3-8)。我们提取了23个qEEG特征。根据颅脑损伤后24、48、72和96h的qEEG特征、年龄和平均动脉压(MAP)以及两个时间间隔的组合,使用随机森林分类器建立预测模型。在对模型进行优化后,我们添加了国际预后和临床试验设计任务(IMPACT)预测指标中的参数,入院时存在的临床、CT和实验室参数。此外,我们还将我们最好的模型与在线IMPACT预测器进行了比较。
结果:57例中重度颅脑损伤患者分为调试组(n=38)和验证组(n=19)。我们的最佳模型包括8个qEEG参数和创伤后72和96h的MAP、年龄和9个其他IMPACT参数。该模型对留一法调试组(受试者工作特征曲线下面积 (AUC) =0.94,特异度100%,敏感度75%)和验证组(AUC=0.81,特异度75%,敏感度100%)的不良结果具有较高的预测能力。IMPACT预测因子独立预测两组的AUC分别为0.74(特异度81%,敏感度65%)和0.84(特异度88%,特异度73%)。
结论:我们的研究显示了使用qEEG参数的多因素随机森林模型预测中重度TBI患者预后的潜力。
关键词:创伤性脑损伤,脑电图,预后,随机森林,ICU
背景
创伤性脑损伤(TBI)患者一直都需要连续的、床旁可用的、最好是非侵入性的工具来可靠地预测神经功能预后。TBI后患者结局的预测模型可能会为监护人提供患者真实的信息,让亲属知道他们的预后。此外,更好的预后预测有助于对脑外伤严重程度进行可靠的量化和分类,对临床决策提供支持。
目前,国际预后和临床试验设计任务(IMPACT)预测因子是脑外伤后神经预后的最佳预测因子。这一在线预测基于一个大型多中心数据库,包括TBI的随机对照试验和观察性研究。建立了临床入院参数的线性回归模型,以预测损伤后6个月的死亡率(格拉斯哥预后评分1)和不良预后(格拉斯哥预后评分1-3)。该模型采集的数据包括年龄、运动评分、瞳孔反应、CT特征、缺氧体征、低血压、血糖和入院时的血红蛋白水平。然而,这种基于入院参数的预测模型没有考虑到脑外伤患者继发性损伤的演变,也没有考虑治疗的影响。
脑电图(EEG)是一种非侵入性的床旁大脑皮质活动的测量方法,尤其适用于镇静或昏迷的患者。连续脑电图(cEEG)通常是ICU脑外伤患者多模式监测的一部分,主要用于检测(非抽搐及非脑电图式)癫痫发作。
已有多项研究试图将脑电图特征与脑外伤患者的功能结局联系起来。较差的结果与(局部)EEG功率降低、EEG减慢、α波减少、EEG(α)变异性降低以及EEG一致性增强有关。然而,大多数研究使用单一的脑电图特征,仅限于损伤后的亚急性期(几天、几周甚至几个月)的轻度脑外伤。考虑到颅脑损伤患者原发损伤的异质性、附带器官功能障碍和继发损伤的演变,多种脑电图特征的组合可能与预后预测具有更好的相关性。此外,计算机算法可以辅助脑电解释,降低了劳动强度和主观性。
作为概念的证明,我们报告了一种cEEG监测工具,该工具使用多定量脑电图(qEEG)特征结合IMPACT预测因子来预测中到重度脑外伤患者的神经学结果。
材料和方法
研究人群
我们在2013年到2018年间,在Medisch Spectrum Twente上进行了两项前瞻性队列研究,记录了中到重度脑外伤患者的cEEG。纳入标准为18岁以上中、重度颅脑损伤(创伤中心或急诊科的格拉斯哥昏迷分级≤12的患者)入住ICU(预期)超过24小时者。排除标准为创伤后出现或合并严重循环衰竭(心脏骤停或脑出血)、早期颅脑损伤或CVA未完全康复、进展性脑部疾病(肿瘤、神经退行性疾病)或TBI发生前预期寿命有限(<6个月)的患者。由于脑电图是我们日常护理的一部分,机构审查委员会免除了书面知情同意的需要。在2013年至2016年的第一个队列中,结果评估要求获得口头同意。对于更大规模的临床研究,我们从2017年开始,进行脑电图测量时获得了法定亲属的书面知情同意,(如果可能的话)在随访期间也会从患者那里获得书面知情同意。
结果评估
入院12个月后患者的结果评估由两名研究人员中的一人通过电话询问获得。主要的预后评估是在TBI后大约一年的扩展格拉斯哥预后评分(GOSE),分为不良预后(GOSE1-2)和良好预后(GOSE 3-8)。
临床参数
入院时记录了患者年龄、性别、脑外伤发生时间和损伤严重程度评分。从电子病历中,我们回顾了纳入前7天的以下数据:异丙酚、芬太尼、咪达唑仑的使用和平均动脉压(MAP)。年龄是脑外伤后恢复的一个重要预后因素,低血压与脑外伤后预后不良和死亡率的增加相关。所有患者在任何时候的年龄和MAP特征都被记录下来。
IMPACT预测因子和参数
对于每个患者,IMPACT分类的预测都是在线计算的。入院时的IMPACT参数包括年龄、运动评分、瞳孔反应、CT特征(Marshall CT分级、硬膜外血肿、外伤性蛛网膜下腔血肿)、二次损伤(低血压和缺氧)以及实验室参数(血糖和血红蛋白)。
EEG记录
连续脑电图记录在入住ICU后尽早开始,持续到7天,除非患者苏醒或ICU治疗结束。19个电极(银/氯化银杯状电极或皮下金属丝)按10-20国际标准放置。使用带有Refa放大器的神经中枢EEG系统(TMSI,荷兰),以256 Hz的采样频率记录。
EEG特征
在伤后24、48、72和96h,用0.5~30 Hz的零相六阶Butterworth带通滤波器对60min的脑电数据进行预处理。使用定制的计算机算法来检测伪影并去除共同平均参考值中10s窗口内的相关通道。伪影包括空通道和具有大峰值或噪声的通道(振幅≥150或≤−150μV和变异度≥1400或≤1μV2)。经过预处理后,计算纵向双极组合范式中每个10分钟窗口的所有qEEG特征。
每频段的绝对功率
计算各频段的功率谱密度(PSD):Δ(0.5-4 Hz)、θ(4-8 Hz)、α(8-13 Hz)、β(13-20 Hz),计算各频段的绝对功率。据此,我们使用Welch方法估计了每个通道的PSD,重叠率为50%,并在10分钟的窗口内对60个时段的PSD进行了平均。
总功率
所有功率带(0.5-20 Hz)的总和为总功率。
每频段的相对功率
每个频段的相对功率被定义为该频段内的功率与总功率的比率。
ADR
α/δ比(ADR)由α(8-13 Hz)和δ(0.5-4 Hz)频段的功率比计算。
SEF90
频谱边缘频率90%(SEF90)是90%的功率位于较高频率以下的频率。
每个频带的功率变异性
通过每个频带的中位数绝对偏差(MAD)与中位数功率之比计算,得到介于0(无变异性)和1(高度变异性)之间的值。
大脑对称性指数
大脑对称指数(BSI)被用来计算左右半球每对电极之间的能量对称性,以0(对称)到1(高度不对称)之间的值表示。在0.5-20 Hz(总功率)和0.5-4Hz(增量功率)的频率范围内计算BSI。
重心
重心(COG)量化了能量在头顶的分布,代表了某一频段内能量最大的地形位置。计算左右(x)和前后(y)方向的COG,表示为从−1到1的值。
平均幅度
平均幅度被定义为信号的标准差。
一致性
一致性被定义为使用4s的汉宁窗口和2s的重叠,在所有可能的通道组合之间的所有平方一致性的平均值,从而产生介于0(无同步)和1(完全同步)之间的值。
香农熵
香农熵是按照香农的定义计算的。更高的熵表明系统更复杂,更难预测。
规律性
规律性是基于信号幅度的变化来衡量脑电模式的连续性的一种度量。规律性在0和1之间归一化,值越高表示信号的幅度越规则。
使用MatLab R2018a(the MathWorks,Inc.,Natick,MA)进行脑电预处理和特征计算。
多因素模型
我们建立了随机森林分类器,这是一种有监督的机器学习方法,它使用自举样本将多个单独的分类树组合在一起,在每个节点随机选择特征来确定分组。预测结果来自不同分类树的投票百分比。因为使用更大的样本量可以提高模型的预测精度,所以我们使用了更多的观察数据:对于每个患者,都收集了脑外伤后24、48、72和96小时的6个10分钟窗口的脑电图特征。如果在这些时间间隔内患者没有可用的数据,则使用前一个小时和下一个小时(以及随后的倒数第二个小时或下一个小时)的可用数据。
使用R库(随机森林,R 3.5.1)中的随机森林包基于Breiman的随机森林分类进行建模。通过观察出袋误差找到最佳的树个数,并将其设置为100个,最大节点数设置为20个。作为第一步,我们建立了一个结合所有脑电特征、年龄和MAP的随机森林分类器,用于预测颅脑损伤后24、48、72和96h的结果。同样,模型是根据两个区间的所有(6)种可能的组合来计算的。其次,选择了10个最重要的特征,并将其用于创建新模型。第三,创建新的模型,将IMPACT模型中的各个参数添加到具有10个参数的模型中。
采用“留一法”的方式进行分组调试评估。不良结果定义为阳性分级。采用50%可信区间的ROC曲线下面积(AUC)进行模型比较。不含IMPACT参数(1)且包含IMPACT参数(2)的AUC最高的模型用于在未调试的外部数据集上进行验证,并与IMPACT预测器(3)进行比较。最后,还对这三个模型进行了训练和评估,以预测GOSE1-4定义的不良结果。
结果
研究对象为57名患者。患者被分为调试组(2013年至2016年包括38名患者)和验证组(2017年至2018年包括19名患者)。符合条件的患者纳入和排除的流程图如图1所示。
图1 符合条件的患者纳入和排除的流程图。排除标准为发生在严重循环衰竭后的或合并严重循环衰竭(心脏骤停或脑出血)的创伤,早期TBI或CVA未完全康复,进展性脑部疾病(肿瘤,神经退行性疾病),或TBI前预期寿命有限(<6个月)。此外,由于实际原因,有些患者没有被纳入,例如,如果患者在研究小组不知情时入院。
表1显示了基线特征。无论是调试组(p=0.037)还是验证组(p=0.016),神经结果良好的患者都明显更年轻。两组患者的损伤严重程度评分和脑电图监测持续时间均无差异。
表1 调试组和验证组的患者特征
接受调试的38名患者中有15名在入院期间死亡(GOSE1),15名患者在1年后神经功能恢复良好,GOSE评分在3-6分之间。其余8名患者因无法通过电话联系而失去随访。因此,我们根据他们的医疗记录来评估患者的预后。其中两名患者出院时处于植物人状态,并被分配到预后不良组(GOSE1-2),另外6名被分配到预后良好组(GOSE3-8)。在验证组中, 所有患者都进行了随访。19名患者中有11名患者的神经学结果良好,其余8名患者的结果较差。
模型选择和调试组的性能
基于所有qEEG特征、年龄和MAP的初始模型的AUC为0.79-0.83。我们只选择了10个最佳特征的模型在单个时间间隔上的平均AUC为0.86,在随后的组合间隔(24和48、48和72、72和96)上的平均AUC为0.88,在1天的组合间隔(24和72、48和96)上的平均AUC为0.82。在这些特征较少的模型中,具有72和96(72和96)h特征的模型是最好的模型,AUC为0.88。将IMPACT参数添加到我们最好的模型的特征中,使调试组的AUC增加到0.94(特异度为100%,灵敏度为75%)。该模型随后被用于验证,并独立地与IMPACT预测器进行比较。
验证组的性能
我们的最佳模型在验证组中分类为不良结果,没有IMPACT参数的AUC为0.75,包含IMPACT参数的AUC为0.81,其特异度和敏感度分别为83%对75%,0.88对100%(图2)。
图2 在调试组(38名患者)和验证组(19名患者)中,我们的最佳模型(具有和不具有IMPACT特征的最佳模型)的受试者操作特征(ROC)曲线,以及在线国际预后和临床试验设计任务(IMPACT)对不良结果(扩展格拉斯哥结果分级1-2)的预测。红点表示敏感度和特异度最好的阈值。有IMPACT 特征的模型的曲线下面积(AUC)高于没有IMPACT特征的最佳模型,与单独的IMPACT预测器相似。在调试组和验证组中,带有IMPACT参数的最佳模型的敏感度和特异度都略高于单独使用IMPACT 预测器的敏感度和特异度
IMPACT预测器的性能
IMPACT预测器在我们的调试组上独立预测的AUC为0.74(灵敏度65%,特异度81%),在验证组上的AUC为0.84(灵敏度88%,特异度73%)。然而,与我们的最佳模型(包括EEG和IMPACT参数)相比,最佳阈值下的灵敏度和特异度较低(表2)。
表2显示了有和没有IMPACT参数的最佳模型的模型性能以及IMPACT预测器的性能。该表还显示了这些模型在使用调整后的GOSE二分法(1-4对5-8)时的性能。
特征贡献
最佳模型使用了19个特征(8个qEEG、MAP和年龄,以及9个入院时的其他IMPACT参数),其中每个特征的贡献如图3所示,按相关性从高到低的排序。脑电图的平均波幅、年龄和MAP是所有模型的重要特征。在颅脑损伤后72+96h的模型中,最相关的特征起源于72h,而96h的平均波幅也对模型的预测性有很大贡献。从IMPACT参数来看,入院时的血糖水平对模型的预测能力有很大贡献。其次,入院时的运动评分和血红蛋白水平是具有中等相关性的特征。最不相关的是瞳孔反应,低血压,缺氧,以及CT扫描中硬膜外血肿或创伤性硬膜下出血的存在。后者的得分也低于脑电图特征。
表2 基于脑电图特征、平均动脉压和年龄的最佳模型的性能,最佳模型包括入院时的IMPACT特征和独立的IMPACT预测因子,预测不良结局的扩展格拉斯哥预后分级(GOSE)1-2和GOSE1-4。对于调试组和验证组的内部验证,显示了患者数量(N)、50%可信区间的受试者操作特征曲线(AUC)值下的面积,以及最佳阈值下的灵敏度和特异度。
图3 显示了创伤性脑损伤后72+96h最佳模型的贡献。脑电图的平均波幅(std)、年龄和平均动脉压(MAP)是重要的特征。入院时的血糖水平对模型的预测能力有很大贡献。瞳孔反应(瞳孔)、低血压、低氧和CT扫描时硬膜外血肿或外伤性硬膜下出血(分别为CT-EDH和CT-tSAH)是最不相关的特征。条形表示特征在预测好的或差的结果中的贡献
讨论
我们开发了一个多因素模型,作为使用机器学习算法的概念证明,该算法包括qEEG特征和临床相关参数,用于中到重度脑外伤患者预后的预测。我们最好的模型包括颅脑损伤后72和96h的qEEG特征和MAP,以及入院时的临床(IMPACT)参数。我们的模型在调试组上的AUC为0.94,在验证组上的AUC为0.81。在调试组和验证组上,我们最好的模型的灵敏度和特异度都略高于单独的IMPACT预测因子,而ROC的AUC相似。
尽管人们在过去的几十年里,已经进行了多次尝试,将单个脑电图参数与脑外伤后患者的预后联系起来,但还没有基于多个qEEG参数预测中重度脑外伤后急性期患者预后的模型报道。
年龄和72小时的MAP也是相关的预后指标,这与早期文献所说的年龄是脑外伤后恢复的一个重要预后因素是一致的。根据颅脑损伤后72小时和96小时的记录特征进行预测是最理想的。这段时间间隔正处于二次损伤的风险中,因此这段时间可能对脑外伤患者的预后有很大影响。虽然72+96h的模型被选为概念验证的最佳模型,但这并没有统计学上的证据,所有模型在调试组中的不同(个体)时间间隔都表现良好(平均AUC为0.86)。因此,未来的研究可以对其他时间间隔的模型进行研究。此外,时间演变可能还有额外的预测价值。在72和96h,因病人死亡或苏醒而转到普通病房,参与研究的病人数量有所下降。没有直接死亡风险且具有觉醒不确定性的患者仍然留在ICU,这类患者的照顾者也可以使用这一更好的决策支持工具。
从IMPACT参数来看,入院时的血糖水平对模型的预测能力贡献最大。Murray等人已经指出,TBI的预后模型应该包括实验室数据,尤其是葡萄糖,尽管他们发现与影响预测因子中的其他参数相比,葡萄糖的影响要小一些。与我们的模型最不相关的是瞳孔反应、低血压、缺氧,以及CT扫描中硬膜外血肿(EDH)或创伤性硬膜下出血的存在。相反,Steyerberg等人的研究发现,大多数预测信息都包含年龄、运动评分和瞳孔反应,而CT信息提供了额外的信息,尽管这些信息对于预测目的来说可能不够详细。Lee等人(2019)最近的研究表明,在前72小时内没有后主导节律、没有睡眠阶段N2瞬变、主要的Δ波活动和不连续的背景分别与3个月后的不良结局相关,并将IMPACT预测因子的预测能力从0.65提高到0.77。由于我们侧重于定量分析,而不是视觉脑电分析,因此这些脑电特征没有被纳入我们的概念证明研究中。但是,未来它们可以被添加到脑外伤后的预测建模中。
脑电图测量比IMPACT预测更耗时。电极涂抹大约需要45分钟,目测分析每天大约1-2小时。这可以通过支持视觉分析的计算机算法和电极设计的发展来大大减少耗时。如果基于脑电图的模型的预测能力超过了IMPACT预测器的预测能力,那么其得益可能会超过这些额外的努力。
我们研究的一个优势是记录了中到重度脑外伤患者7天高质量的连续脑电图测量。另一个优点是,与只使用入院时参数的IMPACT预测不同,基于纵向qEEG参数的预测考虑了脑外伤患者治疗因素和异质性病理演变的影响。事实上,我们最好的模型与独立设置的IMPACT数据具有相似的预测能力,这对于一个仅对30名具异质性的TBI患者进行调试的模型来说是一个令人鼓舞的结果。我们选择了随机森林分类器,因为它具有防止过拟合的能力,并使用留一法对模型进行调试,这也降低了过拟合度。多因素数据的随机森林模型的一个局限性是它缺少对缺失数据的观测。由于这个原因,我们在建模时没有考虑其他可能的相关临床参数,如颅内压,这些参数并不是所有患者都能获得的。
我们研究的局限性在于,我们的主要结果,即GOSE,没有考虑到非神经性死亡原因(对于多发性创伤患者),而患者的生存取决于临床决策。此外,最好将不良结局组定义为死亡至重度残疾(GOSE1-4),将良好结局定义为中度残疾至恢复良好(GOSE5-8)。由于GOSE评分为5-8分的患者数量较少,且有8名患者未完成随访,我们主要选择将不良结果定义为GOSE12。在预测GOSE1-4分的不良结果时,模型性能确实较差。将MAP作为预测参数的一个缺点是,通过治疗可以对其进行人工控制,以优化血流动力学或脑灌注压。虽然MAP包含在预测模型中,但其贡献率相对较低(不在最相关的前5个因素中)。由于脑电图特征也依赖于MAP和CPP,这可能解释了它对结果预测的低附加值。QEEG特征没有因去骨瓣减压术或癫痫活动的潜在影响而进行校正。虽然这可能会增加脑电图的平均幅度,但较低的平均幅度是不良结局的有力预测因素。
本研究的另一个局限是,调试组和验证组在时间上来自不同的队列。然而,我们不认为这是一个影响研究的因素,因为在这段时间内治疗没有变化,不良结局的比率相对相似。调试组和验证组的大小低于预测模型的理想大小,只与IMPACT预测因子进行验证和比较。然而,在这项概念证明研究中,我们展示了随机森林模型在这方面的潜力。
应使用更大的数据集进一步开发模型,并分别使用GOSE1-4和5-8来区分神经学结果差和好。对于未来的研究,可以通过纳入更多来自多个时间段和医疗中心的数据以及通过优化模型参数(即树和节点的数量)来获得更高的泛化能力。
我们发现,在创伤后的第一天,qEEG参数可以提供有用的信息来预测中重度颅脑损伤后的预后。最终,使用来自多个监测脑功能的模式的数据可能会在ICU的中重度TBI患者中带来更好的决策支持工具。
结论
使用qEEG特征、临床数据和放射学发现的多因素随机森林模型有可能预测中重度TBI患者的神经学结果。