基于EEG信号的生物识别系统影响因素分析

摘要:由于指纹、语音或面部等传统特征极易被伪造,因此寻找新的生物特征成为当务之急。对生物电信号的研究也因此具有了开发新的生物识别系统的潜力。使用脑电信号是因为其因人而异,并且相比传统的生物识别技术更难复制。这项研究的目的是基于脑电信号分析影响生物识别系统性能的因素。此项研究使用了六个不同的分类器来对比研究离散小波变换的几种分解级别作为一种预处理技术,同时还探讨了记录时间的重要性。这些分类器是高斯朴素贝叶斯分类器,K近邻算法(KNN),随机森林,AdaBoost(AB),支持向量机(SVM)和多层感知器。这项工作证明了分解程度对系统的整体结果没有很大的影响。另一方面,脑电图的记录时间对分类器的性能有较大影响。值得说的是这项研究使用了两组不同的数据集来验证结果。最后,我们的实验表明,SVM和AB是针对此特定问题的最佳分类器,它们分别实现了85.94±1.8,99.55±0.06,99.12±0.11和95.54±0.53,99.91±0.01和99.83±0.02的灵敏度、特异性和准确率。

1.介绍

随着科技的飞速发展,生物识别系统出现在许多日常场景中以提供数据的安全性。当今时代,大多数智能手机至少有一个嵌入式生物识别系统,通常是指纹或面部识别。除此之外,在需要更严格的安全保障时,可以选择生物识别系统来保护重要的数据。例如,银行可以使用它们来对其客户的账户提供安全访问。      许多类型的生物学特性可以用来开发生物识别系统。但是其中的许多生物学特性容易受到暴力攻击、伪造或直接强迫用户的影响。除此之外,大多数生物识别系统始终存在的问题是它们无法保证用户还活着。为了克服这些问题,脑电图信号是作为生物特征的最佳选择,将脑电信号作为生物识别技术的主要优势包括:

普遍性:所有人类大脑都有神经元,这些神经元产生电活动,可以以EEG信号的方式读取。任何年龄和任何精神状态(包括植物状态或昏迷)的人都会产生这些信号。

独特性:基于脑电的人体识别研究表明,脑电信号在不同的人之间有足够的差异,可以对他们进行分类。

永久性:一些验证脑电图随时间变化的研究表明,脑电信号在开发生物识别系统方面保持了很大程度的可重复性。

规避性:传统生物识别技术最关键的问题之一,是无需征得用户的同意就可以收集特征。而没有一种技术可以远程记录脑电波。此外,通过强迫用户进行EEG录制而产生的负面情绪会导致身份验证失败。

尽管EEG信号有许多优点,但基于它们开发生物识别系统仍具有挑战性。在对这些信号进行处理之前,需要对其进行预处理,因为它们包含频带和人们头部的各个层面产生的混合信号。经过预处理之后,可以正确提取正在进行的EEG中的各个独立特征。最新技术提出了可以从这些信号中获得的大量功能,以及可以用于此任务的许多分类算法。但是对于进行生物识别,没有标准的记录时间。

本文的研究旨在提供对离散小波变换(DWT)作为预处理和特征提取技术的详细分析。此外,本文还研究了记录时间对分类器和DWT性能的影响。除此之外,本研究旨在建立不同分类算法之间的比较,以选择最适合开发此类系统的算法。本文的主要贡献是分析了基于EEG的生物识别系统开发中所需的一些基本组件,此分析将增进对可能影响系统性能的因素的理解。

2. 方法

2.1 数据说明

本研究中使用的EEG信号对应于两个不同的数据集。第一个是开放获取的DEAP数据集,第二个是BIOMEX-DB,这是一个私人数据集,记录在INAOE中。使用两个不同的数据集的目标是验证不同数据源的结果。

DEAP数据集包含32名健康参与者(50%是女性)的脑电图,年龄在19岁到37岁(平均年龄27岁)之间,记录了他们对40个视频(每个视频一分钟)所做出的反应。采用这个数据集的目的是分析人类的情感状态,出于这个原因,在每段视频之后,参与者都会对他们的效价、唤醒能力、优势和喜好进行评级。每个记录有32个EEG通道、12个外围通道、3个未使用通道和1个状态通道。此外,在这项工作中,实验使用了该数据集的预处理版本。该方案对512 Hz至128 Hz的信号进行下采样,采用盲源分离技术去除眼电伪影,并采用4-45 Hz的带通滤波器。

另一方面,BIOMEX-DB数据集的目的是开发不同形式的生物识别系统。这项工作使用了数据集的脑电图部分,由51名健康参与者(49%女性)组成,年龄在16岁到61岁(平均年龄29岁)之间。对每个参与者进行135段2.5秒的录音,每段录音都是1到10个数字的发音。此外,每个EEG有14个通道的信息,频率为2048 Hz,但它被下采样到128 Hz。

2.2  预处理

虽然这项工作中使用的DEAP数据集版本已经进行了预处理,但在这两个数据集中,都应用了离散小波变换。如前所述,由于其非平稳特性,该技术在脑电信号分析中特别有用。此外,这种变换具有揭示与EEG信号相关的特征的优点,而这些特征对于其他技术来说并不明显。      小波分析包括将EEG信号表示为一组特定小波的线性组合。这些小波是一个被称为母小波的主函数平移和扩张的结果。许多小波都可以作为母小波,但Daubechies-4(DB4)在处理脑电图时应用较多,因为它的平滑特性可以检测这些信号中的变化。      本文比较了四种不同的分解层次,分析了它们对系统性能的影响。首先,进行五级分解,得到以下频段:32-64Hz ; 16-32Hz; 8-16Hz; 4-8Hz; 2-4Hz以及<2HZ(A5)。这些频带对应于与特定功能相关的五个主要大脑节律。图1显示了一个五级DWT。第二种离散小波变换具有四个层次的分解,因为许多作者提出它是为了减少数据量。此外,还应用了三级和两级分解来分析它们对生物识别系统的影响。

图1. 具有5层分解的离散小波变换

2.3 特征提取

提取的近似系数和细节系数是EEG信号在时间和频率上的能量分布的紧凑表示。即使这些系数可以用作特征向量,也有更紧凑的特征可以表征原始信号。Hamad等人提出了使用DWT系数计算的10个特征,但本研究仅使用相对小波能量(RWE),因为该特征已被证明在其他脑电信号应用中是有用的。分类这项研究在识别问题上遵循封闭集策略,这意味着在训练时分类器看到了所有测试类的示例。此外,还采用了多类分类方法,其中对于每个数据集,分类类别的数量等于受试者的数量。对6种不同的分类算法进行了评价,对它们进行了比较,选择了最适合这一特定问题和数据集的分类算法。之所以选择这些分类器,是因为每个分类器都基于不同的标准来执行分类。分类器包括:支持向量机(Support Vector Machine,简称SVM)、K-近邻(KNN)、随机森林算法、高斯朴素贝叶斯(GNB)、AdaBoost(AB) 和多层感知器(MLP)。

2.3.1  超参数优化

为了选择每个分类器的超参数,采用贪婪搜索优化方法。对学习算法的超参数空间的手动指定子集进行穷举搜索是该优化的基础。在这项工作中,十次交叉验证被用来指导贪婪优化的性能。      每个数据集的超参数优化都是独立进行的,但两个数据集的超参数子集是相同的。此外,在每个数据集中,随机选择每个受试者20%的可用数据来执行这一步骤。为了避免这一过程影响实验结果,在后续阶段不使用该数据。表1包含在贪婪搜索优化过程中测试的一组值;第一列显示分类器名称,第二列显示超参数的名称,最后一列显示可能的值。表2中列出了为每个数据集和分解级别找到的最佳超参数值,其中括号中的是分解级别2、3、4或5,星号表示所有分解级别使用相同的值。

表2. 使用DEAP和BIOMEX-DB数据集为每个分类器和分解级别选择最佳超参数(在括号中),(*)表示为所有分解级别选择相同的值。

2.4 性能度量和实验验证

平均准确率(ACC)、宏观平均敏感度(Se)和宏观平均特异度(Sp)被用来衡量分类算法在这种多类场景中的性能。      为了提高实验结果的可靠性,本研究采用了十倍交叉验证的方法。在这两个数据集中,实验使用了80%的可用数据,因为超参数优化过程使用了剩余的20%。通过随机选择每个受试者75%的信号用于训练和25%用于测试来执行数据集的训练-测试分割。这种拆分数据集的方式保证了在培训和测试阶段使用每个参与者的相同数量的信息。此外,每个文件夹中包含的信息对于所有分类算法都是相同的;图2说明了这个验证过程。

图2. 验证进程表示形式

此外,为了验证每个分类器获得的结果是否显著不同,使用了两种多变量技术。Hotelling的T2检验允许比较两种算法,而对于两种以上算法的比较,则采用多变量方差分析(MANOVA)。Yıldız等人的结果表明,多变量检验比单变量误差检验具有更高的说服力;也就是说,它们可以检测出误差检验所不能检测到的差异。

2.5 实验说明

实验的目的是评估脑电记录的持续时间和离散小波变换的分解程度对分类器性能的影响。在这两个数据集中,每个信号被分割成以下时间:0.25、0.5、0.75、1、1.25、1.5、1.75、2、2.25和2.5s。为了模拟真实场景中记录之间可能存在的差异,随机开始分割。图3显示了实验的一般流程图。

图3. 实验流程图,用于评估脑电记录的持续时间和分解程度对性能的影响

3.实验结果

本研究中使用的两个数据集的结果和分析分别给出。图4显示了使用DEAP数据集的每个DWT级别中的所有分类器实现的敏感度;它仅基于敏感度,因为这是最低的性能度量。此外,特异性和准确性行为与敏感性行为相同。此图说明了DWT分解级别和分类器之间的依赖关系。例如,KNN、RF、AB和MLP倾向于使用两个级别的分解来获得更好的结果,而GNB和SVM则倾向于使用三个级别的分解。

图4. 基于DEAP数据集的按DWT分解级别分组的分类器敏感度盒图

另外,图4显示系统的性能与脑电记录时间高度相关。然而,应用Hotelling的T2检验来验证每个时间段之间在最大使用时间方面是否存在显著差异,即2.5s。在该测试中使用了每个时间段中分类器的灵敏度、特异性和准确性。值得一提的是,此分析应用在分解的每个级别;表3是这些测试的结果。此表显示,当使用两级和五级分解时,从1.75s的记录开始,分类器的性能不再有显著差异。另一方面,经过三层分解后,这一时间缩短到1.5s。最后,使用四层离散小波变换时,时间增加到2s。

表3. 在每个时间段的结果和使用DEAP数据集记录的2.5s之间的Hotelling T2测试检验的结果p值,粗体值是大于0.05的p值。

我们使用MANOVA验证了表3的结果。在此测试中,p值小于或等于0.05表示比较值之间的显著差异。在两级分解的情况下,得到的p值为0.21(>0.05),验证了从1.75s的记录开始,系统的性能没有显著变化。同样的情况也发生在五级分解的情况下,其中p值为0.19。另一方面,当将MANOVA应用于三个水平的分解结果时,得到的p值为0.05(≤0.0 5)。因此,仅使用从1.75s开始而不是从1.5s开始获得的结果进行相同的分析,结果p值为0.14。最后,对于四个水平的分解,比较两秒记录的结果得到的p值为0.32。      总的来说,使用该数据集的最佳分类器是支持向量机,因为在记录时间为1.75s,分解为3个水平时,其灵敏度、特异度和准确率分别为85.94±1.8、99.55±0.06和99.12±0.11。另一方面,使用相同的数据,GNB分类器的敏感性、特异性和准确性最差,分别为47.97±2.26、98.32±0.07、96.75±0.14。这些结果可能是因为该分类器假设输入独立。但是,在这个实验中,条目高度相关。表4显示了仅使用三个分解级别的详细分类结果,因为它是最好的级别。此外,图5给出了使用最佳分解级别和1.75s记录的每个分类器的混淆矩阵。

表4. 使用DWT和DEAP数据集的三个级别的分类结果

图5. 使用三层分解、1.75s记录和DEAP数据集的分类器混淆矩阵

对于BIOMEX-DB数据集,图6显示了每个DWT级别的分类器所实现的灵敏度。结果表明离散小波变换的分解程度对分类器的性能没有显著影响。因此,对来自所有时间段中关于分解级别的所有分类器的数据应用MANOVA。得到的p值为0.1,说明不同分解级别之间的性能差异不显著。此外,在不考虑对应于两级DWT的数据的情况下执行相同的分析,同时p值增加到0.85。      此外,与DEAP的情况一样,应用Hotelling的T2检验来验证每个时间段和最大使用时间之间是否存在显著差异。表5的内容为测试的结果。该表表明,当使用三级和五级分解时,从1.5s的记录开始,分类器的性能不再有显著差异。然而由于p值接近0.0 5,在随后的分析中只使用了1.75s记录的结果。对每个级别的分解使用MANOVA来验证该表的结果。两级、三级、四级和五级分解的p值分别为0.11、0.17、0.19和0.28,说明在记录1.75s的脑电信号后,分类器的性能没有显著差异。

在这种情况下,采用3个分解水平、记录1.75s的最佳分类器为AB,其灵敏度、特异性和准确性分别为95.54±0.53、99.91±0.01和99.83±0.02。但是,应用MANOVA来验证AB和RF实现的性能之间是否存在显著差异时,分析得到的p值为0.99,这一结果表明AB和RF的性能几乎相同,这是可以理解的,因为AB的弱分类器是RF。在图6中,还可以看到SVM和MLP是最不稳定的分类器,因为它们的方差很高。使用三个分解级别的详细分类结果可以在表6中看到。最后,图7显示了使用最佳分解级别和1.75s记录的每个分类器的混淆矩阵。

表6. 使用DWT和BIOMEX-DB的三个级别的分类结果

图6. 使用BIOMEX-DB数据集绘制的按DWT分解级别分组的分类器敏感度的盒图

图7. 使用三层分解、1.75s记录和BIOMEX-DB的分类器混淆矩阵

4.结论和未来工作

本文提出了一个基于脑电信号分析的生物识别系统,系统的每个部分都使用了一种在最先进的范围中极力推荐的技术。为此,采用离散小波变换(DWT)作为预处理方法,提取相对小波能量作为特征,对6种不同的人工智能模型进行测试,从中选出最优的模型。      作为下一步的工作,需要对脑电信号通道进行分析。对通道的研究可以通过只选择提供有价值信息的通道来减少系统必须处理的数据量。同时,它还可以提高该类型系统的可移植性。此外,还应按研究对象进行分析,以进一步调查可能影响实现良好用户识别所需的脑电记录时间的因素。另外,由于深度学习的快速发展,需要对这些类型的神经网络进行测试,以便进行更全面的比较。在这项工作中,只研究了基于脑电信号的单峰生物识别系统的开发。因此,研究使用经典信号(如语音、人脸或指纹)和生物电信号(如心电图)的多模式系统的开发,以分析这如何减少EEG记录所需的时间并提高系统的安全性将有重大的研究意义。

0人点赞

日记本

(0)

相关推荐

  • 韩国政府资助的基于BCI的大脑和认知技术的开发,用于通过深度学习识别用户的意图

    更多技术干货第一时间送达 该项目由韩国政府资助的信息与通信技术规划与评估研究所(IITP)资助(No. 2017-0-00451,基于BCI的大脑和认知技术的开发,用于通过深度学习识别用户的意图) 网 ...

  • DeepKey:科学家提出一种基于脑纹独特性的多模态生物识别系统可以防范身份欺骗

    ‍‍‍‍‍‍‍‍‍‍ ‍‍‍‍‍‍‍‍‍‍ 生物识别认证则包括利用个体独特的.可测量的生理和行为特征识别个体的各种技术. 传统的生物识别系统如人脸识别.虹膜.视网膜.声音和指纹技术当前被广泛应用,然而 ...

  • ​用机器学习和神经科学解码大脑信号

    更多技术干货第一时间送达 人脑是一个非常了不起的器官,它大约三磅重,却能控制着我们身体的所有功能.它处理我们所有的思想,它是人类智力.创造力.情感和记忆的神经生物学基础.我们的大脑分为几个部分,每个部 ...

  • EEG脑机接口算法

    目前大多数基于EEG的脑机接口的算法都是基于机器学习算法.正如我们在2007年的论文中写的,这个领域中使用了多种多样的分类器.现在,在那篇综述发表后的十年内,许多新的算法已经被开发和测试,用来对脑机接 ...

  • ​利用卷积神经网络学习脑电地形图表示进行分类

    更多技术干货第一时间送达 脑电图(EEG)地形图表征(Electroencephalography topographical  representation, ETR)可以监测区域大脑活动,是一种可 ...

  • 基于分类任务的信号(EEG)处理

    更多技术干货第一时间送达 本文由网友Jon_Snow_Stark授权分享 对于很多从没做过信号处理以及分类的小伙伴来说,面对信号数据真的是不知道该如何下手.既然大家来看这篇博文,我相信,大家与我一样, ...

  • Boston和MIT研究人员利用脑电信号实时控制机器人

    更多技术干货第一时间送达 Hello,大家好! Rose小哥今天介绍一篇利用大脑信号来控制机器人的人机交互方式.类似的文章可以参考<脑机头条 第38期|  能玩"剪刀石头布" ...

  • 【脑电信号分类】脑电信号提取PSD功率谱密度特征

    更多技术干货第一时间送达 本文是由CSDN用户[frostime]授权分享.主要介绍了脑电信号提取PSD功率谱密度特征,包括:功率谱密度理论基础.matlab中PSD函数的使用介绍以及实验示例.感谢 ...

  • 基于深度学习的脑电图识别 综述篇(二)数据采样及处理

    更多技术干货第一时间送达 作者|Memory逆光 本文由作者授权分享 导读 脑电图(EEG)是一个复杂的信号,一个医生可能需要几年的训练并利用先进的信号处理和特征提取方法,才能正确解释其含义.而如今机 ...

  • 年轻人苦睡眠久矣!这项黑科技躺着就把问题解决了

    1924年,德国科学家Hans Berger首次探测到了大脑表面的活动. 来自大脑的神秘信号,第一次有了定义. 从那之后,人类对大脑的探索就从未停止. 甚至于,以脑电波技术为基础的脑机接口也成为了当下 ...

  • 运动想象系统中的特征提取算法和分类算法

    更多技术,第一时间送达 特征提取算法 (1)时域方法:这是比较早期的EEG信号处理方法,主要通过提取EEG的波形特征,比如振幅.方差.波峰等,对EEG信号进行分析: (2)频域方法:运动想象EEG信号 ...

  • 从脑电图(EEG)中提取稳定的模式进行识别

    更多技术干货第一时间送达 本篇文章是论文<Identify Stable Patterns over Time for Emotion Recognition from EEG>(< ...

  • 脑电与情绪简介

    更多技术,第一时间送达 情绪定义与情绪表示 情绪是对一系列的主观认知经验的通称,它包括人对外界刺激或自身刺激的心理反应,以及其伴随的生理反应.美国心理学家William James以及丹麦生理学家Ca ...

  • 【学术论文】多模态意识任务的脑电信号空间源定位分析

    摘要: 为了分析附加汉字默读的多模态意识任务所激活的大脑皮层,采用空间源定位分析与意识任务相关的脑电信号.首先采用独立分量分析算法将所有电极的脑电信号分解为各自独立的分量,每个分量可视为来自一个等价偶 ...

  • 基于EEG信号的情绪识别

          情感在日常生活中有着重要的作用,不仅在人类互动中,而且在决策过程中,以及在对我们周围世界的感知中.由于最近研究界对建立人和计算机之间的情感互动表现出兴趣,因此需要识别前者的情感状态.这可以 ...

  • 基于深度学习网络的运动想象BCI系统及其应用

    更多技术干货第一时间送达 研究人员提出了一种基于深度学习模型的运动想象脑机接口(BCI).运动想象的脑动力学通常通过EEG作为低信噪比的非平稳时间序列进行测量.研究人员经过调研发现,以往对MI-EEG ...

  • 论文周报 | 第4期

    更多技术,第一时间送达 在这篇文章中,作者使用机器学习方法研究了情感识别过程中脑电图(EEG)随时间变化的稳定模式.本论文专注于识别情绪识别中的脑电图稳定性,并使用DEAP数据集和SEED数据集,系统 ...

  • 论文周报 | 第11期 验证深度神经网络对脑电信号运动想象的在线解码​

    更多脑机干货第一时间送达 第11期 论文周报 抱歉各位脑机接口社区的好朋友,今天分享来晚了.Rose小哥昨天回家了,坐了一天的车,今天一大早又赶着外甥女的生日,这会才抽出时间来分享.估计在家的这段时间 ...

  • EEG-MI 基于EEG信号的运动想象分类实验

    更多技术干货第一时间送达 本文由网友"坐在云朵上的kiwi"授权分享 项目背景 "脑机接口"(Brain Cpmputer Interface, BCI)研究的 ...

  • DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

    更多技术干货第一时间送达 DEAP数据库简介 DEAP[1](Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦 ...