本文提出了一种采用卷积神经网络(CNN)的帕金森症(Parkinson's disease,PD)自动检测系统。PD的特征是大脑中运动功能的逐渐退化。由于它与脑异常有关,脑电图(EEG)信号通常被考虑用于早期诊断。在本研究中,我们使用了20个PD和20个正常受试者的脑电图信号。实现了一种可以克服传统特征表示阶段需求的13层CNN架构。该模型具有88.25%的准确率、84.71%的灵敏度和91.77%的特异性。在安装临床使用之前,已开发的分类模型已准备好用于大量受试者。本文于发表在Neural Computing and Applications。(可添加微信号siyingyxf或18983979082获取原文)。关键词:计算机辅助检测系统 卷积神经网络 深度学习 帕金森病思影科技曾做过多期关于脑电机器学习相关的文章解读,可结合阅读,直接点击下文链接(红色为我个人特别推荐的文章):
脑电信号处理的机器学习
EEG分类实验block设计的危险与陷阱
Current Biology:视觉想象和视觉感知共享Alpha频带中的神
利用脑电连通性特征和卷积神经网络的情绪分类
脑电研究:通过神经活动和视觉特征的多模态学习
JAMA Psychiatry:使用机器学习的方法探究焦虑和创伤性障
Nature neuroscience:利用encoder-decoder模型实现皮层活
ANNALS of Neurology:中风恢复过程中脑机接口可促进运动
Nature Biotechnology: EEG特征预测重度抑郁症的抗抑郁药反应
BMC Medicine:自闭症谱系障碍静息态EEG信号的定量递归
SCIENCE ROBOTICS:非侵入式神经成像可增强机器控制
Lancet Neurology:一种供四肢瘫痪患者使用硬膜外无线脑机
Lancet经典:植物人意识状态的床边检测
NATURE子刊:出生第一年的纵向EEG power能识别孤独症谱
EEG机器学习:急性脑损伤临床无反应患者脑
STROKE:用于慢性中风患者运动康复的动力外骨骼的健侧脑-机
PNAS:基于脑电在线神经反馈调节唤醒程度可以改善个体
帕金森病认知图谱的EEG机器学习
BRAIN:机器学习:基于EEG的跨中心、跨方案的意识
脑机接口训练可持久地恢复中风病人的上肢运动功能
人类的大脑在出生时包含最大数量的神经细胞,也称为神经元。PD通常伴随着神经元的死亡。神经元产生一种化学物质,称为多巴胺,其主要功能是控制身体的运动。因此,随着神经元的死亡,大脑中产生的多巴胺数量减少。因此,这种神经状况开始逐渐发生,并影响到大脑中的各种沟通模式。据观察,50岁或50岁以上的人会被诊断出患有PD。这种疾病的主要症状是姿势不稳定、肌肉僵硬、动作缓慢、震颤、平衡丧失和精细运动技能受损。根据世界卫生组织提供的统计数字,这种疾病已夺走近1000万人的生命。当没有观察到明显的运动或非运动症状时,诊断该疾病有困难。因此,计算机辅助诊断(CAD)系统可能有助于早期发现异常。CAD系统是一种利用脑电信号客观诊断PD的自动化检测系统。大脑皮层和皮层下部分的功能很容易通过脑电图来识别。神经系统疾病,如癫痫,精神分裂症,阿尔茨海默病也可以用脑电图信号来确定。因此,我们在本研究中利用脑电信号开发了检测PD的CAD系统。根据以往的研究,脑电信号本质上是复杂和非线性的,因此,许多线性特征提取方法无法准确地描述这些信号。当脑电信号显示复杂性时,PD会加重。这是由于脑电信号中存在的非线性分量。因此,非线性特征提取技术的应用将有助于区分正常和PD的EEG信号。然而,机器学习的一个分支称为深度学习,近年来,在模式识别和自然语言处理的多个领域得到了成功的应用。卷积神经网络(CNN)是研究人员采用的最流行的深度学习框架之一。与大多数传统的机器学习算法不同,它允许通过训练数据来学习更高层次的特征,而不需要人为干预。据我们所知,这是第一篇针对PD的CAD(计算机辅助诊断)系统实现深度CNN的论文。我们已经实现了一个新的十三层深度CNN来描述这两个类别(PD和正常)。图1是提出的网络的体系结构。网络和每个层的详细信息将在后面的章节中介绍。
它是一种将特征提取和分类过程有效结合起来的机器学习类型。从输入数据中提取的特征被用来建立一个鲁棒的CNN模型,然后在测试阶段测试所开发模型的诊断性能。CNN模型在Acharya等人最近的论文中分别使用脑电信号自动检测癫痫和抑郁症,取得了成功。CNN的基本层包括卷积、最大池化层和完全连接(密集)层。通常,随着网络的深入,网络往往会学得更好。然而,这可能会影响计算时间。因此,我们仔细设计了需要较短计算时间的网络体系结构。在训练阶段对参数进行精细调整,得到了最高的分类性能。卷积层使用核(窗口)与输入信号卷积。卷积后生成下一层的特征映射。之后,采用批处理归一化层对输入的训练数据进行归一化,使其在中间层之间流动,目的是使学习更快。然后,将校正后的线性单元应用于输入数据的阈值,减少了数据中的冗余。为了减少特征映射的大小,使用了最大池化层。最后,最大池化层的每个神经元都连接到完全连接层中的每个神经元,输出预测输入信号的结果(正常或PD)。所提出的体系结构的概述如图1所示。模型的验证分为两个步骤进行:首先,训练数据,然后对模型进行测试。在训练过程中,引入分层十折交叉验证,其中完整的数据被分成10等份。在10个部分中,9个用于训练模型,其余部分用于测试。这个过程被迭代了十次,这样所有部分都将涉及到训练和测试阶段。第二,为了评估每个部分结束时训练的进展,分配了20%的交叉验证训练数据来验证模型。使用学习率为0.0001的Adam优化(Adam虽然可以自动调整学习率,可是初始学习率过大,很可能直接收敛到很差的局部最小值点,而后面的学习因为学习率已经被降低,就再也跳不出去了。所以不宜过大。一般的框架中,默认学习率1e-3。),我们已经使用了一些激活函数,例如所有层的Relu和最后一层的Softmax。对于dropout层,dropout值设置为0.5。表1显示了所有层的内部细节。所有参数都相应地调整到训练集,只要给出最佳的训练精度。通过蛮力法(也称为穷举法或枚举法)得到核大小和滤波器个数。
如果您对脑电及其他心理认知研究数据处理感兴趣,欢迎浏览思影科技课程及服务(可添加微信号siyingyxf或18983979082咨询):
第二届脑电机器学习数据处理班(南京,4.6-11)
第八届脑电信号数据处理提高班(南京,3.29-4.3)
第十二届脑电数据处理入门班(南京,3.19-24)
第十一届近红外脑功能数据处理班(上海,4.13-18)
第九届眼动数据处理班(上海,4.6-11)
第十三届脑电数据处理入门班(上海,4.19-24)
经医院伦理委员会批准,采集年龄在45岁至65岁之间的20例PD患者(10名女性和10名男性)的脑电图信号。这些患者的PD平均周期为5.75±3.52年(从1后到12年不等)。Hoehn和Yahr阶段[30]如下:轻微的精神状态检查(mini-mental status examination,MMSE)发现被试在正常限制范围内[26.90±1.51(范围25-30)]。排除包括存在其他神经疾病的被试,如癫痫或精神疾病,抑郁症和其他急性精神障碍。一共招募了20名同年龄组的正常人(9名男性和11名女性,平均年龄为58.10±2.95岁),没有过去的神经或精神障碍记录或迹象。健康参与者的MMSE结果为27.15±1.63年。被试都是右利手。此外,这些受试者听力正常,参与者通过向他们解释所涉风险的可能性,寻求对这项研究的同意。记录在静息状态下持续5分钟(放松觉醒状态)的EEG,采样率为128Hz。使用emotive EPOC的14导电极帽。参与者被要求舒适地坐在安静的房间里,并在实验前被告知在实验期间不要进行身体运动(例如眨眼)。实验后,将信号分割成2s窗口长度。采用阈值技术删除超过±100uV的信号来去除眨眼伪迹。然后,采用六阶带通巴特沃斯滤波技术,滤波频率范围为1-49赫兹。最后,对1588个无伪迹部分进行了进一步分析。图2显示了正常和PD脑电图记录样本。
图2 正常和PD被试的EEG信号
所有脑电信号均采用CNN模型,采用Python语言的Keras,在一台系统配置为两个Intel Xeon2.40GHz(E5620)处理器的计算机上执行,具有24GB的随机访问内存。本文采用了以下评价参数,即准确性、灵敏度和特异性。学习率为0.0001,达到最佳诊断性能。所提出的CNN模型的准确率为88.25%,灵敏度和特异性分别为84.71%和91.77。图3和图4分别显示了有无dropout层的模型的性能。可以发现,如果没有dropout层,数据就有可能出现过拟合。在图3中,训练集的准确性与验证集的准确性没有太大的区别,而在图4中,验证集的准确性比训练数据要差得多。图5显示了我们的结果的混淆矩阵。可以发现,11.34%的正常受试者被错误地归类为PD,11.51%的PD被错误地归类为正常。
图3 不同分段数量的预测准确性
图4 没有dropout时的不同分段数量的预测准确性
图5 本研究的混淆矩阵
在过去的几年里,人们提出了几种无创技术来识别PD,如使用语音和步态信号,探索了不同的自动化技术,开发最佳的自动化模型,以区分正常和PD受试者。Chen等人认为特征约简法可以消除PD语音信号中不必要的信息。此外,他们还报告了使用主成分分析特征简约技术和模糊k近邻(FKNN)分类器的平均诊断准确率为96.07。后来,Zuo等提高了精度,采用蜂群智能算法,辅以FKNN分类器对正常和PD语音信号进行分类。此外,Ma等提出了一种将聚类算法与基于核的极端机器学习分类器相结合的方法来表征来自正常语音信号与PD语音信号,平均准确率为99.49%。另一方面,Daliri采用基于傅里叶变换对正常步态和PD步态信号进行分类的特征判别法,分类准确率达到91.20%。然而,使用脑电信号诊断PD的研究数量有限。根据所进行的研究(见表2),可以注意到,在正常和PD受试者中,采用了各种机器学习技术来区分脑电信号。Han等进行了一个实验,以研究正常和PD脑电信号的特点。他们报告说,PD的脑电图信号的熵值明显高于正常的脑电图信号,这表明PD脑电信号更加复杂。Yuvaraj等采用高阶统计量(higherorder statistics,HOS)特征提取技术来区分这两类信号。据报道,HOS可以很好地表示PD EEG信号中隐藏的非线性特征以用来分类。
然而,在本研究中,我们提出了一种深度CNN架构来检测PD。这种方法的新颖之处在于建立了一个十三层网络,利用脑电信号区分PD和正常人。此外,本研究不需要手工挑选特征。这大大减少了实验和选择最佳特征集进行分类的过程。此外,为了进一步提高CAD(计算机辅助诊断)系统的效率,我们提出了一种基于网络的诊断技术。图6描述了基于网络的CAD系统的工作流程。本系统利用互联网对PD患者进行诊断。从患者收集的脑电信号存储在诊所的本地存储服务器中,并通过云端发送给我们开发的CNN模型,诊断结果从云端发回诊所。此外,这种基于网络的应用程序的优点是诊断结果可以通过短信直接发送给病人。因此,随着这一系统的安装,诊所的临床医生将能够大大减少他们的工作量。
图6 基于云端的CAD系统的PD诊断
1.设计了13层CNN模型,利用脑电信号自动识别PD。2.在所提出的CNN模型中,不需要对特征进行提取、选择和分类。4.这是首次实现利用脑电信号检测PD的深度学习技术。5. 即使在正常和PD受试者较少的情况下,它也能获得良好的性能。因此,鲁棒性好。1.它使用有限数量的(20正常和20PD)受试者来开发CNN模型。2.与传统的机器学习技术相比,CNN结构的计算成本很高。在未来,作者打算使用开发的模型与庞大的数据库,从不同的种族和年龄组来进行分类。此外,这些技术还可以用来检测其他大脑异常,如自闭症、阿尔茨海默病、抑郁症和睡眠障碍。提出了一种利用脑电信号诊断PD的13层CNN自动模型。此外,这是第一次实施深度学习概念来诊断PD的脑电信号。尽管受试者数量有限,我们获得了88.25%的准确性,84.71%的敏感性,91.77%的特异性。基于所获得的良好性能,该模型可以作为一个可信的和长期的工具,在PD诊断中帮助临床医生。在未来,作者提出用大量的研究对象来测试所开发的模型,并旨在检测PD的早期阶段。