华裔教授AI解码脑电波，上演现实版“读脑术”，大脑所想直接合成文本或语音！

2024-06-10 08:04:13

许多患有神经疾病的患者因丧失语言能力，需要依赖特定的通讯设备进行沟通，这类设备大多利用脑机接口或者头部、眼睛的动作来控制光标，以选择屏幕上的字母，从而拼出他们想说的句子。但是，这个蹦单词的过程，实在无法与人类的正常说话过程相比。

3 月 30 日，《自然-神经科学》发表了美国加州大学旧金山分校华裔教授 Edward Chang 及同事开发的一款脑电波 AI 解码器，能够将大脑活动信号直接转化为句子文本。

具体而言，研究人员首先通过电极记录受试者说话时的神经活动信号，并用特定语句和神经信号特征之间的关联数据训练 AI 算法，试验证明，训练后的机器翻译算法能够准确地解码受试者的神经活动，并将其接近实时地翻译为句子文本，错误率低至 3%。

从大脑“读取”人的意图

说话似乎是一件毫不费力的事，但实际上说话却是人类执行的最复杂的活动之一。十多年前，科学家首次从大脑信号中解码语言，但是一直以来，语言解码的准确性和速度远远低于自然语言交流。

目前一些用于大脑控制打字的脑机接口技术，其实依赖的是头部或眼睛的残余非语言运动，或者依赖于光标控制以逐个选择字母并拼出单词，这种方式目前可以帮助瘫痪的人通过设备每分钟输出多达 8 个单词。

但与流程自然语言交流时每分钟 150 个单词的平均速度比起来，现有技术的输出速度还是太慢了。

使用特制语音合成器与外界交流的史蒂芬·霍金

理论上来说，脑机接口技术可以通过直接从大脑“读取”人的意图，并使用该信息来控制外部设备或移动瘫痪的肢体，来帮助瘫痪的人完成说话或运动。

为了获得脑机接口直接解码语言更高的精度，研究人员利用了机器翻译任务与从神经活动解码语音到的相似性。也就是说，和机器翻译类似，解码语言也是从一种语言到另一种语言的算法翻译，两种任务实际上映射到同一种输出，即与一个句子对应的单词序列。只不过，机器翻译的输入内容是文本，而解码语言的输入内容是神经信号。

于是，研究人员盘点了机器翻译领域的最新进展，并利用这些方法训练循环神经网络，然后尝试将神经信号直接映射为句子。

语言相关的神经活动解码过程

具体而言，研究人员通过电极记录四名受试者他们大声读出句子时的神经活动。之后，研究人员将这些数据添加到一个循环神经网络中，从而将规律性出现的神经特征表示出来，这些神经特征可能与言语的重复性特征（比如元音、辅音或发音器官接收的指令）相关。

接着，研究人员通过另一个循环神经网络逐字解码这种算法表示，形成句子。研究人员发现，明显参与言语解码的脑区，同样参与言语生成和言语感知。通过这种机器翻译算法，研究人员在一名受试者身上进行试验，结果证明通过神经活动解码为口头句子的错误率低至 3%。

此外，如果利用某人的神经活动和言语对循环网络进行预训练后再在另一名受试者身上进行训练，最终的解码结果有所改善，这意味着这种方法在不同人员之间或许是可转移的。但是，还需要开展进一步的研究来更加完整地调查这个系统的功能，将解码范围扩展到研究所限语言之外。

脑机接口+AI 合成语音

直接通过解码大脑活动信号来合成文本或语音，不只是一项科幻般的“读心术”，更是一种颇有前景的治疗方案。

控制光标进行单词拼写，只是离散字母的连续串联，而解码语言则是一种高效的通信形式。与基于拼写的方法相比，直接语音或文本合成具有诸多优点，除了以自然语速传递无约束词汇的能力之外，直接语音合成还能捕获语音的韵律元素，例如音调、语调等。

此外，对于由肌萎缩性侧索硬化或脑干中风引起的瘫痪患者，通过直接记录来自大脑皮层的神经控制信号来合成语音，是实现自然语言高通信速率的唯一手段，也是最直观的方法。

去年 4 月，Edward Chang 等人还在 Nature 杂志发表了开发出一种可以将脑活动转化为语音的解码器。这套人类语音合成系统，通过解码与人类下颌、喉头、嘴唇和舌头动作相关的脑信号，并合成出受试者想要表达的语音。

Edward Chang 教授

为了重建语音，研究人员设计了一种循环神经网络（RNN），首先将记录的皮质神经信号转化为声道咬合关节运动，然后将这些解码的运动转化为口语句子。

整个过程分为两个步骤，第一步，将神经信号转换成声道咬合部位的运动（红色），这其中涉及语音产生的解剖结构（嘴唇、舌头、喉和下颌）。而为了实现神经信号到声道咬合部位运动的转化，就需要大量声道运动与其神经活动相关联的数据。但研究人员又难以直接测量每个人的声道运动，因此他们建立了一个循环神经网络，根据以前收集的大量声道运动和语音记录数据库来建立关联。第二步，将声道咬合部位的运动转换成合成语音。

研究人员的这种两步解码方法，产生的语音失真率明显小于使用直接解码方法所获得的语音。在包含 101 个句子的试验中，听者可以轻松地识别并记录下合成的语音。

在科幻世界里，通过意念信号控制外界设备十分酷炫，实际上，在现实世界中，其背后的脑机接口技术已有近百年的历史。

随着脑机接口领域科学研究与应用技术的不断突破，尤其是 AI 算法的加持，为许多当前仍无法解答的难题提供更好了的探索工具，不仅能够帮助人类进一步了解自己的大脑，更重要的是为诊断、治疗脑部及其它严重疾病提供了解决方案，甚至广泛应用于睡眠管理、智能生活和残疾人康复等领域。

参考资料：
https://nature.com/articles/s41593-020-0608-8
https://www.nature.com/articles/s41586-019-1119-1
https://mp.weixin.qq.com/s/ZjAW1CDUli1VXpWcNnF-sQ

《认知推理：人工智能的下一个浪潮》，点击下方图片跳转查看全文及解读！

《2020科技趋势报告》重磅发布，点击下方图片跳转查看全文及解读！

脑机头条第41期| 华裔科学家AI解码脑电波，准确率高达97％

更多脑机干货第一时间送达 2020年4月8日脑机头条第41期近几年,随着自然语言技术的快速发展,各大公司的语音助手产品的表现越来越好.现在我们已慢慢习惯这些语音助手的方便和先进了. 而现在,有一 ...
NEJM黑科技：人工智能语音信号解码技术帮助失语瘫痪患者恢复语音交流能力

北京时间今天凌晨,美国加州大学旧金山分校和伯克利分校医工结合团队在<新英格兰医学杂志>(NEJM)发表研究论文,介绍了他们利用脑机接口和人工智能解析卒中后失语患者大脑信号.从而恢复其语言交 ...
科学家利用脑机接口让患者正常发声

说话在我们看来似乎是一项很简单.毫不费力的活动,但它却是我们执行的最复杂的动作之一.它要求声道的发音结构(嘴唇.舌头.喉和下颌)进行精确.动态的肌肉协调.当中风.肌萎缩侧索硬化症或其他神经系统疾病导致 ...
PNAS：婴儿大脑中语言的正交神经编码

对人类大脑来说,从不断变化的语音信号中创造出不变的表示是一项重大挑战.这种能力对于语言习得前的婴儿尤为重要,因为他们必须发现一个极不一致的信号在语音.词汇和句法上的规律,才能习得语言.在视觉域内,克服 ...
迈向“超人认知”：脑机接口的未来

大脑无疑是人体中最复杂.最神秘的器官. 作为智力的中心,运动的策划者以及我们感官的歌喉,大脑不仅仅是一个被外壳和液体包裹着的3磅重的器官.相反,它是定义自我和广义上的人性的皇冠上的明珠. 几十年来,研 ...
现实版“读脑术”来了！“植物人”患者的福音→

意识障碍患者被人们俗称为"植物人"."植物人"除保留一些本能的神经反射和基本的新陈代谢外,丧失了与外界沟通的能力,他们虽然活着,却如同在沉睡.由于治疗和护理费用 ...
华裔科学家AI解码脑电波，准确率高达97％

更多脑机干货第一时间送达近几年,随着自然语言技术的快速发展,各大公司的语音助手产品的表现越来越好.现在我们已慢慢习惯这些语音助手的方便和先进了. 而现在,有一项技术却可以将我们的大脑活动转化为完整的 ...
外媒再放狠话!高通芯片并非"翻车":上演现实版黑客帝国故意留漏洞

[5月13日讯]相信大家都知道,自从国产手机老大哥华为遭受到"芯片禁令"以后,旗下自研华为麒麟芯片也因为无法得到芯片代工厂商的芯片代工服务,华为手机业务也因此遭受到巨大的冲击,也让 ...
湖南上演现实版“熊二吃蜂蜜”，黑熊摸黑偷蜂蜜，吃干一箱没抬头

狗熊爱吃什么?<熊出没>中的熊二早就告诉我们了:那一定是蜂蜜. 据<长沙晚报>报道,今年的5月1日夜间,湖南省常德市石门县就上演了一出真实版的"熊二偷吃蜂蜜" ...
白俄罗斯政变细节曝光，克格勃出动，上演现实版“碟中谍”

白俄罗斯政变细节曝光，克格勃出动，上演现实版“碟中谍”
《回家的诱惑》上演现实版世贤看品如和别人结婚

八年前一部<回家的诱惑>教会了女人们防偷防盗防闺蜜,当年这部剧首播的时候也创造下不小的收视率,所以普及程度还是挺大的.剧中一开始似乎很美好,富家子洪世贤和林品如结婚了,本来看似平静的婚姻, ...
汉族男友拜访哈萨克族女友家，上演现实版007，请再给他们一点帮助！

原创都护君西域都护昨天最近几周的周末,笔者家都在上演现实版"007". 因为,我在内地上学,而男朋友工作单位离我家不远,所以经常会去我家看望母亲和弟弟. 所以,男朋友来我家 ...
鹦鹉成群侵扰，澳大利亚一居民区上演现实版《鸟》的故事

这简直是一场灾难.莫斯曼公寓的居民实在难以忍受北悉尼邻居养的大量鹦鹉所带来的噪音和伤害.这是真的令人沮丧,连续几个小时的尖叫,一位居民说.每当鸟儿开始飞行,你就会备感焦虑,上帝,又来了,它们这是要飞多 ...

华裔教授AI解码脑电波，上演现实版“读脑术”，大脑所想直接合成文本或语音！

《2020科技趋势报告》重磅发布，点击下方图片跳转查看全文及解读！

相关推荐