复旦大学冯建峰团队发布全球首个数字挛生脑平台

人脑很多时候是诸多科学实验的伦理禁区,但是如果有一个大脑的数字拷贝副本,那么不论是想了解脑机接口设备的功效还是破解大脑的功能,都可以“随心所欲”地进行。复旦大学冯建峰团队日前发布数字孪生脑(Digital Twin Brain:DTB)平台,将为脑科学家进行数字实验,探索和验证神经科学理论、大脑智能机理提供支持,也将为借鉴生物智能实现人工智能的突破提供新的视角和方法。

团队发布的数字孪生脑平台是国际上首个基于数据同化方法开发的具备860亿神经元规模、百万亿突触的全人脑尺度大脑模拟平台。

通过平台研究工作发现,数字孪生脑在规模与结构上越接近人类大脑,会逐渐展现出类似在人脑中观测到的临界现象与相似的认知功能。

该研究成果以《类脑计算模拟和探索人类大脑的静息和任务状态:尺度与结构》为题,发表在《国家科学评论》(NSR)。该文将作为封面文章收录于NSR“人类大脑计算与类脑智能”专题。

人类大脑作为自然界中最神秘、最复杂的信息处理系统,包含了约860亿个神经元,这些神经元之间又有着超过100万亿个突触连接。了解大脑的动态可塑性和巨大复杂的网络结构,弄清智能发生的机理,借鉴生物智能实现人工智能的突破一直面临巨大挑战。而通过数字孪生脑,可以为实现人工智能的突破提供一个全新的视角和方法。数字孪生脑平台利用和借鉴数字孪生技术,通过逆向工程技术构建生物大脑的数字副本,“破译”脑在信息处理与神经编码原理的方式,实现从结构仿脑到功能仿脑。

2023年底,美国国家科学院发布关于发展数字孪生的整本白皮书, 其中,关于数字孪生脑的研究内容就占了1/3,提出了从人脑实验数据结合方式来验证和研究大脑智能的机理。欧共体也在人脑计划结束之后启动了EBRAIN, 并于2024年开始了一千万欧元资助的虚拟脑孪生的项目。

冯建峰谈到,“我始终认为,人脑是目前唯一通用的‘人工智能’。此次的数字孪生脑平台构建工作才刚刚开始第一步,为探究大脑结构与相应高级认知功能的复杂关系提供了一个研究实例。数字化模拟真实大脑是实现理解大脑工作原理、启发未来通用人工智能的有效途径之一。我们研究中遇到的问题,都代表着模拟脑在计算硬件、系统以及计算方法领域的严峻挑战, 是未来长期研究的焦点。”

自然语言大模型GPT3和GPT4的参数量在千亿规模,成年人全脑860亿神经元至少有百万亿神经突触,如何从少量数据(比如MRI、EEG、MEG等)确定如此大规模的模型,是利用全脑模型与数据结合的难点。冯建峰团队发展的多层数据同化方法,为大脑大模型的估计与辨识提供有效的技术手段,通过介观尺度的统计,推断具有人类大脑规模的脉冲神经元网络模型。

全脑模型具有“大规模”与“真实生物结构”,通过构建人类大脑计算模型,并将同化后数字孪生脑与实验采集的静息态与认知实验任务态的BOLD数据进行比较发现,数字孪生脑与真实大脑在规模尺度和连接结构上越相似,它模拟出的数据与生物脑活动的实验记录在静息状态和任务过程的相似匹配度越高,并且越接近展现出临界现象。而大脑处于临界态被猜想是大脑功能相关的重要时空动力学特征。

数字脑在50亿神经元规模(相当于猕猴大脑神经元规模)的大模型上,会逐渐展现出类似在人脑中观测到的临界现象与相似的认知功能。目前,团队已经完成了860亿神经元、总突触47.8万亿的全脑模型的形态模拟计算。

对于数字孪生脑的应用前景,冯建峰介绍,数字孪生脑平台可以帮助脑科学家进行数字实验,探索和验证神经科学理论、大脑智能机理。如团队利用数字孪生脑进行的数字损伤实验时,在模型中切断了初级视觉皮层(V1)到下游视觉途径的连接移除会显著降低数字脑模型与真实大脑在海马中的相似性,发现对整个大脑的影响很小。数字孪生脑还可以用来开展无生物主体时的“干”实验,研究团队通过设计“丘脑”信息驱动与“内感知”信息驱动的HAD实验范式,来测试静息状态下脑活动反映了内部身体状态的假设,发现内感知回路的信息驱动范式显著增强了模型与生物大脑之间的相似性。