据外媒CNET报道,一项新技术可以在很大程度上将大脑活动转化为合成语音,从而真正恢复那些失去说话能力的人的天赋。加州大学旧金山分校(UCSF)的神经科学家创造了一种脑机接口,通过一种新颖的两步过程来解释来自大脑语言区的信号。
研究人员没有试图将大脑活动直接转换为声音,而是将神经信号转换为人们声道的运动,用于以数字方式创建这些声音。
因此,人工语音更接近真实的人类语音,并开始接近正常的对话速度。
“我们演示了使用计算机模拟来明确模拟参与者的声带运动——包括嘴唇、舌头、下巴、喉咙………………
去年,麻省理工学院采用了切线相关法,用耳机接收大脑发送到嘴巴和下巴的信号。
新的系统正在常的实验室中开发,该团队的进展在周三发表在杂志《自然》上的一篇新文章中进行了概述。
研究人员对一些志愿者进行了这项研究,他们在大脑中植入了临时电极,为癫痫的神经外科治疗做准备。当他们的大脑活动被记录下来时,他们被要求大声朗读数百个句子。这些数据和参与者的声音记录使科学家能够创建一个虚拟的声音轨道。然后,可以通过大脑活动来控制用于创建语音的解剖结构的详细计算机模拟。下面的视频展示了一些结果的例子。
“这项研究首次表明,我们可以根据个人的大脑活动来生成完整的口语句子,”常在一份声明中说。“这是一个令人兴奋的原理证明,即在技术已经触手可及的情况下,我们应该能够在语言丧失患者中建立一个临床可行的设备。”
目前,严重语言障碍患者的许多设备需要逐字逐句地思考,每分钟可以产生多达10个单词。但是一个可以翻译整句话的系统,可以让人交流得更快,甚至可以以接近每分钟100-150个自然音的速度交流。
“作者的两阶段方法导致声学失真的显著减少,”没有参与这项研究的生物医学工程师Chethan Pandarinath和Yahia H. Ali说。“然而,仍然存在许多挑战.重建语音的可懂度仍然远远低于自然语音。”
这项研究的新合作者Josh Chartier坚持认为,他们的系统产生的准确性水平将改善现有的技术,但承认有一种方法可以完美地模仿英语口语。
“我们非常擅长合成较慢的声音,如‘sh’和‘z’,以及保持声音的节奏和语调以及说话人的性别和身份,但一些更生硬的声音,如‘b’和‘p’,会变得有点模糊。”
另一个有希望的发现是,用于声音运动的神经代码不一定对每个人都是唯一的。“不能移动胳膊和腿的人已经学会用大脑控制机器人的四肢,”沙特尔说。“我们希望有一天,有语言障碍的人可以通过这种大脑控制的人工通道重新学习说话。”