当前位置:首页 期刊杂志

脑与认知技术发展综述

时间:2024-07-28

祝翠琴

(北京理工大学计算机学院,北京100081)

1 引 言

通用人工智能(Artificial General Intelligence,AGI)通常有两种开发方式:一种基于电脑思维(以计算机科学为导向),另一种基于人脑思维(以神经科学为导向)。两种方法的计算方式和编码程序完全不同。在通往通用人工智能的道路上,前者的探索实践更长、研究完备性更强。但是另一方面,人类在认识世界和改造世界的过程中,也从自然界和生物特征上汲取了大量的灵感和经验,基于脑与认知的通用人工智能研究已经成为近年来学术界和业界的一个重要研究热点[1-2]。脑与认知是受生物大脑神经运行机制和认知行为机制启发,以计算建模为手段,通过软硬件协同实现的机器智能。纵观脑与认知领域近期技术与应用成果,重要发展方向包括:类脑仿生研究与应用改进人工智能系统重建复杂的大脑皮层神经网与回路是当前研究重点;神经拟态计算延续火热势头,脉冲神经网络被认为是目前深度神经网络的“继承者”;脑机接口技术发展呈现非侵入式趋势,面向语言障碍病患实现语音合成的脑机接口技术成为近期新兴研究方向。

图1 脑与认知技术是发展通用人工智能的重要环节Fig.1 Brain and cognition technology is an important component of Artificial General Intelligence(AGI)

2 类脑仿生研究与应用改进人工智能系统

类脑仿生技术充分学习人脑(及其他生物脑)的思维模式,从仿生角度努力寻求人工智能的突破,成为一门前景可观、应用范围广阔的热门学科。在某种程度上,一个国家类脑仿生技术的发展水平将极大程度影响该国在军事、工业等众多行业的未来发展,因此类脑仿生技术的发展显得尤为重要与急迫。2019年8月,《Nature Communications》认为,对于建模人类和动物的大脑结构与机理,进行动物大脑的模仿与借鉴,比当前广泛采取的基于有监督策略训练人工神经网络更为重要[3]。因为动物在漫长的历史进化过程中发育和具备了高度结构化的大脑连接,使它们能够快速学习和适应,这种“先天”的神经结构直接决定了动物的技能与习性。从另一个角度,动物(包括人类)出生后具备快速学习和适应的能力,很大程度上是因为天生就具备一个高度结构化的大脑连接。近年来的研究已经证明,类脑仿生研究在加强对人脑认知和理解方面具有重要意义。以昆虫大脑(仅含1000 个神经元)为模型的人工智能比试图重建人类大脑(86亿个神经元和100 万亿突触)要容易得多。这些生物可能会表现出更强的主观性,这就将简单的查表法扩展到了与人工智能相关的潜在问题解决上。此外,生物系统甚至可以帮助研究者在机器人身上复制“意识”的元素。纵观近期人工神经网络的一些发展,不难看出其中很多成果都有神经科学的影子。例如,DeepMind的Alpha家族的成功就是从动物学习的研究中汲取的灵感,计算机视觉领域最核心的模型卷积神经网络的设计灵感则来自于视觉皮层的结构等。

2019年1月,美国国防预先研究计划局(DARPA)发布微观仿生鲁棒性人工智能网络(Micro-BRAIN)项目,旨在寻找能够理解微型昆虫的感觉和神经系统并将其转化为“原型计算模型”的方案和模型。预期该方案和模型可实现硬件集成以模拟昆虫的思维和行为,为衍生更小、更节能、更容易训练的机器人铺平道路。

2019年7月,哥伦比亚大学团队宣布完整破解线虫神经网络,这对解密大脑功能产生机理具有重要意义。该成果成功绘制出秀丽隐杆线虫(脑细胞占比超过30%)全部神经元的完整图谱以及全部神经元之间所有的7000个连接。进一步地,把所有神经元分到了不同层次,进而解释了信息在线虫神经网络里的传递流程与规律。该成果发表于《Nature》[4]。虽然该研究也面临可迁移性较差的问题,因为即便是线虫个体之间也会存在差异,而目前学术界对此尚无有效解决办法,但是该研究的意义仍是巨大的,它是历史上首次补全了线虫头部负责执行繁重计算任务的神经环,首次完整提供了动物神经系统对脑结构的直观解释,首次阐释了大脑功能如何从神经回路中产生。该成果被认为是迈出了认知神经元相互作用机理以产生不同行为的重要一步。

2019年8月,美国谷歌公司基于果蝇的大脑切片,自动重建了完整的果蝇大脑神经图。整个过程中,谷歌公司使用了数千个TPU 进行计算,并应用Flood-Filling 网络来自动追踪果蝇大脑中的每一个神经元,最终获得了拥有40万亿像素的果蝇大脑神经图。谷歌公司计划与美国霍华德·休斯医学研究所和英国剑桥大学合作,利用该重建技术加速研究果蝇大脑的学习、记忆和感知机理。

2019年11月,德国马克斯·普朗克脑研究所推出跨度七年的重要研究成果:重建复杂的大脑皮层神经网络,揭示了迄今为止最大哺乳动物神经线路图,首次阐释了哺乳动物神经元的连接机理。该成果利用人工智能的方法,通过高空间分辨率从小鼠桶状皮质的第四层重建了约50 万立方微米的体积(比以前从哺乳动物的大脑皮层进行的密集重建约大300 倍)。该成果为进一步探明大脑高效计算原理奠定基础,被认为是仿生人工神经网络研究发展历程中的一个重要里程碑事件。该成果发表于《Science》。

近年来,设计像真实神经元那样响应神经系统电信号的人工神经元一直是医学领域的主要目标,这有可能治疗神经元无法正常工作、突起在脊椎损伤中严重受损或死亡等情况。人工神经元可以通过仿制生物回路的健康功能与充分响应生物反馈来修复病变的生物回路,从而恢复身体功能。2019年12月,英国研究团队发布一款硅芯片人工神经元,它不仅表现得像生物神经元,而且仅需要微处理器十亿分之一的功率,因此非常适合用于医疗植入物和其他生物电子仪器。该成果发表于《Nature Communications》[5]。

3 神经拟态计算持续迅猛发展

神经拟态计算是一种高能效的神经网络计算架构,通过模仿人类大脑的运作极力去求解一个问题答案。相关研究最早起源于20 世纪80年代,由于生物神经元的发射是非确定性的,继而引发出设计集成电路来模仿活神经元细胞组织这一研究思路,以克服经典冯诺依曼“确定性”计算架构在很大程度上让计算机无法模仿人类大脑的困难。神经拟态计算技术利用脉冲信息,通过神经网络的通信方式来解决问题,可以被应用于很多类的问题中,包括自学习、机器人控制、动态控制、稀疏编码等经典问题。

自2017年发布模仿人脑的“神经拟态类”深度学习芯片Loihi之后,英特尔公司在神经拟态计算领域的研究与突破不断,并于2018年成立了英特尔神经拟态研究社区,全面推动神经拟态的发展。2019年7月,英特尔公司发布全新神经拟态系统Pohoiki-Beach。该系统集成了64 颗14nm 工艺的Loihi 芯片[6](该芯片受到大脑启发,将生物大脑原理应用于计算机体系结构,单芯片集成128 个神经拟态计算核心、13 万个神经元、1.3 亿个突触,并提供Python API 等编程工具链)、1320 亿个晶体管,拥有800 万个神经元、80亿个突触。英特尔公司计划在2020年初将载荷提升到768 颗芯片、1.5 万亿个晶体管、1亿个神经元、1万亿个突触。未来的突破远不止于此,因为Loihi芯片摆脱了传统硅芯片的冯诺依曼计算模型并且模仿人脑原理的神经拟态计算方式和异步脉冲神经网络,理论上讲可以扩展至16384 颗芯片互连,相当于超过20 亿个神经元(人类大脑大约有86亿个神经元)。

2019年5月,瑞士神经拟态处理器研发公司aiCTX 开源脉冲神经网络仿真平台,该平台是面向类脑计算的全球首款打通“传统深度学习-脉冲神经网络-类脑芯片通路”的系统仿真平台。2019年7月,aiCTX 宣布与博世公司(Boshc)、英飞凌公司(Infineon)、飞利浦公司等14 家合作伙伴共同开启为期三年的项目。该项目面向实现超低功耗神经拟态运算的重大需求,通过新兴硬件架构及配套存储技术来满足智能终端设备对复杂深度学习算法的应用需求;同时,审视当前主流人工智能技术可能性,并尝试将它们与深度神经网络和脉冲神经网络神经形态运算结合,对每种技术可能性与兼容性进行评估,为人工智能边缘计算趋势的到来做好准备。

脉冲神经网络被认为是目前深度神经网络的“继承者”,因其在运算中合理有效地运用了时域动力学,所以非常适合于实时处理真实世界的传感器数据(例如视频或者声频),尤其是在需要快速实时响应的情况下[7]。所以,神经拟态计算的优势可总结为:从算法设计角度,脉冲神经网络中的脉冲神经元提供了可以在时间域进行实时信息处理的神经网络的基本方法;从硬件实现角度,类脑架构能够利用脉冲机制进行高度稀疏的脉冲驱动运算,大幅度节省了能耗。

神经拟态计算被认为是通向强人工智能的路径,它基于大脑运作机理,与目前主流深度神经网络的方式截然不同,有几个显著的改进:由于并非所有的神经元每次都会激活,所以单个脉冲神经网络神经元可以替代传统深度神经网络中的数百个神经元,从而在功耗和体积方面更胜一筹,成功开辟小型化道路[8];神经拟态计算的迁移能力更强,可以从一种环境中学习并到另一个环境中应用示范,并且突破性地具备记忆和概括能力;神经拟态计算已被证明可以使用无监督的技术从环境中“从零开始”学习,即只需很少的标注样本就可以快速学习,突破传统深度学习对标注样本的严重依赖。

4 脑机接口技术发展呈现非侵入式趋势

脑机接口又名脑机融合感知或大脑端口,通常是指在人(或动物)脑与外部设备间建立的直接神经链路,对运动、感觉、语言等能力缺陷人群具有非常重要的意义。近年来,日益成熟的深度学习技术(模拟类脑深度神经网络)被应用到脑机接口研究中,脑机接口也成为深度学习研究的一个重要方向[9]。临床实验证明,脑机接口技术可以帮助人类快速交流、控制机械臂、恢复瘫痪肢体的感觉和运动等。依托脑机接口技术帮助肢体瘫痪患者也取得了一些进展和技术积累[10],近期新兴研究点关注于验证脑机接口技术对于语言障碍的病患实现语音合成。脑机接口技术应用正向着“扩大人类能力”的目标不断拓展。

2019年3月,美国初创脑机接口公司Neuralink发布了一项能够快速将电线植入老鼠大脑的方法,即在移除一块老鼠头骨并插入一根针头之后将柔性电极植入老鼠的脑组织。该成果被认为是向人类大脑直接插入计算机潜在应用系统迈出的重要一步。2019年7月,Neuralink 公司发布一项在截瘫病患身上植入设备以辅助其操控外部设备(例如手机或电脑等)的新技术。它是将一条只有人头发丝1/4粗细的电极线路植入人脑中,这条电极线路上有一系列微小电极和传感器,可从大量细胞中捕获信息并将其无线发送到计算机以供分析。该成果中电极通道数量可扩容并使用高分子柔性细线,既可采集更多信号,也保障了电极线易植入且不受损,此举超越了以往相关研究,并展示出良好前景,有望创造一个通过机器人手术植入的“高宽带”脑机接口。

2019年4月,美国加州大学旧金山分校团队发布一项基于人工智能技术识别大脑电信号并将其输出为合成语音的技术。该技术包括基于高密度皮层脑电图的言语和发音器官运动跟踪、基于递归神经网络的多级解码合成声频等两个阶段,旨在直接从瘫痪患者的大脑中“读出”他们的意图,并利用这些信息控制外部设备或移动瘫痪的肢体,使瘫痪患者每分钟生成150 个单词(接近正常人类水平)。该成果发表于《Nature》[11]。重构的语音可理解程度仍明显低于自然语音,脑机接口技术能否通过收集更大、更高质量的数据集并继续提高算法性能来不断改进重构语音效果还有待观察。

2019年7月,Facebook 公司发布一项用于构建非侵入式可穿戴设备的脑机接口研究最新进展——基于脉搏血氧仪来检测神经元的氧气消耗。它通过实时感知捕获大脑活动中的预期语音来帮助神经损伤的病患者像正常人一样交流,实现了人们在对话时大脑产生的活动可以实时解码为电脑屏幕上的文字,突破了以往“离线”模式,在脑机接口研究领域首次实现了实时“翻译文字”。该成果发表于《Nature Communications》[12]。这一成果证明了未来通过增强现实可穿戴设备来提高人机交互能力的新的可行性,也预示着相关研究迈向神经植入物的重要一步,能够帮助因中风、脊髓损伤等失去对话能力的病患者辅助交流。

2019年10月,俄罗斯脑机接口公司Neurobotics发布一项非侵入式脑机接口技术,实现了利用人工神经网络和脑电图将人脑中的图像实时可视化。与美国Neuralink公司成果不同,该技术无需激光开颅植入电极,因此在临床应用上更加容易实现。

美国Neuralink公司曾预测,脑机接口技术能够在2021年之前治疗严重的脑损伤。在现实中,通往临床可行的语音合成脑机接口的道路上仍会面临很多挑战与障碍。此外,无法产生语音相关动作的病患者是否能够使用语音合成脑机接口技术是未来研究的一个关键方向。能够解码脑活动的脑机接口商用之路还非常漫长,一方面因为技术成熟度有待提高,且缺乏真实场景的可靠性验证;另一方面,不同科技巨头对脑机接口技术的研发路线各异、标准尚待统一,例如,Neuralink公司的技术路线是开发包含大规模柔性电极的可植入阵列以增强脑功能,Facebook 公司的技术路线是制造借助红外光从外部接收大脑信号的增强现实头戴设备等。

5 结束语

人工智能旨在使机器具备类人智能,而脑与认知技术,则从人类和动物脑回路结构与神经元连接机理角度推动人工智能不断发展,逐渐成为通过训练人工神经网络之外另一个推动人工智能研究的路径。当今在通往通用人工智能道路上取得的成果主要源于人工神经网络的进展,但离预期的达到人类智慧水平还相差很远。人工神经网络可以在游戏,如国际象棋、围棋甚至星际争霸等即时战略类游戏中击败人类对手,但在大多数偏向认知的方面,比如语言、推理、常识等方面,还无法接近四岁儿童的认知能力。在这种情况下,从某种层面而言,脑与认知的研究是探究甚至实现人工智能的最直接技术路线,而且可以为人工神经网络研究提供基础导向,因为人类和动物“先天”的结构对其技能和习性有着决定性作用。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!