欢迎光临本站!

欧盟人脑计划:新算法模拟生物进化,为大脑如何工作提供见解

来源:原创    更新时间:2021-11-21 10:33:37    编辑:星谷下载    浏览:263

欧盟「人脑计划」(Human Brain Project,HBP)正式启动,是欧洲最大的脑科学项目,也是欧盟资助的最大研究项目之一。是欧盟首批为期 10 年、预算 10 亿欧元的「旗舰」项目。这是继人类基因组计划之后的又一个全球性的大科学项目。

在神经科学和信息技术的接口上,HBP 借助计算、神经信息学和人工智能的高度先进方法研究大脑及其疾病,进而推动类脑计算和神经机器人等领域的创新。

           

HBP 主要创始人、著名神经科学家亨利·马克拉姆(Henry Markram)提出,「在 10 年内,用计算机模拟人类大脑的近千亿个神经元以及它们之间 100 万亿个连接」,这个宏伟目标也激发了热烈讨论甚至争议。但因为大脑实在太过复杂,在 10 年内做到这一点确实不易。

2020 年,「人脑计划」这项为期 10 年的项目最后阶段将从「地平线 2020」预算中获得 1.5 亿欧元,这是欧盟的最新一笔拨款。

伯尔尼大学生理学系研究团队参与了 HBP 研究。研究人员现在开发了一种基于所谓进化算法的新方法。这些计算机程序通过模仿生物进化的过程来寻找问题的解决方案,例如自然选择的概念。因此,描述生物体适应环境的程度的生物适应性成为进化算法的模型。

该研究以「Evolving interpretable plasticity for spiking networks」为题,于 2021 年 10 月 28 日发表在《eLife》杂志上。

           

算法模拟生物进化

我们的大脑具有令人难以置信的适应性。每一天,我们都会形成新的记忆、获取新的知识或完善现有的技能。这与我们当前的计算机形成鲜明对比,计算机通常只执行预编程的操作。

我们适应性的核心在于突触可塑性。突触是神经元之间的连接点,根据使用方式的不同,突触会发生不同的变化。这种突触可塑性是神经科学的一个重要研究课题,它是学习过程和记忆的核心。

破译突触可塑性的方法可以大致分为自下而上和自上而下。自下而上的方法通常依赖于实验数据来推导出突触参数的动态方程,如果适当地嵌入到网络中,这些方程会导致功能性出现的宏观行为。自上而下的方法以相反的方向进行:从网络功能的高级描述,例如,根据目标函数,推导出突触变化的动态方程,并建议生物物理学上合理的实现。

           

图示:尖峰神经元网络中突触可塑性规则的人工进化。

为了更好地了解这些大脑过程并构建自适应机器,神经科学和人工智能 (AI) 领域的研究人员正在为这些过程背后的机制创建模型。这种用于学习和可塑性的模型有助于理解生物信息处理,使机器能够更快地学习。

在这里,研究人员建议采用一种自动化方法,来发现明确解决这些问题的尖峰神经元网络中的学习规则。自动化程序将生物可塑性机制的搜索解释为优化问题,这种想法通常被称为元学习或学会学习。

然后,扩展了元学习思想,来发现用于尖峰神经元网络的自由形式但可解释的可塑性规则。采用遗传编程作为搜索算法。

新开发的方法被称为「进化到学习」(evolving-to-learn,E2L) 方法。应用于三种不同的神经元网络学习范式:奖励驱动、错误驱动和相关驱动学习。

研究结果证明了自动化程序在搜索尖峰神经元网络的可塑性规则方面的巨大潜力,类似于从手工设计到现代机器学习核心的学习特征的转变。

惊人的创造力

使用遗传编程 (GP) 作为一种进化算法,来发现尖峰神经元网络中的可塑性规则。GP 将突变和选择压力应用于最初随机的计算机程序群,以人工进化具有所需行为的算法。考虑到数学表达式的演变,研究人员采用特定形式的 GP:笛卡尔遗传编程(Cartesian genetic programming,GCP)。

           

图示:笛卡尔遗传编程中数学表达式的表示和变异。(来源:论文)

研究小组用三种典型的学习场景来对抗进化算法。首先,计算机必须在不接收有关其性能的反馈的情况下检测连续输入流中的重复模式。在第二种场景下,计算机在以特定的期望方式执行时,会收到虚拟奖励。最后,在第三个「引导学习」的场景中,计算机被精确地告知其行为与预期的偏离程度。

           

图示:笛卡尔遗传编程进化出各种有效的奖励驱动学习规则。(来源:论文)

           

图示:笛卡尔遗传编程进化出高效的错误驱动学习规则。(来源:论文)

           

图示:笛卡尔遗传编程进化出各种相关驱动的学习规则。(来源:论文)

「在所有这些场景中,进化算法都能够发现突触可塑性的机制,从而成功地解决了一项新任务,」伯尔尼大学生理学系的通讯作者和共同第一作者 Jakob Jordan 博士说。

在这样做的过程中,算法表现出了惊人的创造力:「例如,算法发现了一个新的可塑性模型,其中我们定义的信号被组合成一个新信号。事实上,我们观察到使用这个新信号的网络比以前比使用已知规则的网络学习得更快。」该研究的共同第一作者、RIKEN 脑科学中心的 Maximilian Schmidt 博士强调说。

「我们认为 E2L 是一种很有前景的方法,可以深入了解生物学习原理,并加快向强大的人工学习机器的发展,」Mihai Petrovoci 说。「我们希望 E2L 能加速对神经系统突触可塑性的研究,」Jakob Jordan 总结道。

这些发现将为健康和患病的大脑如何工作提供新的见解。还可能为开发能够更好地适应用户需求的智能机器铺平道路。


评论区

表情

共0条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~

相关内容

点击排行

随机新闻

评论排行榜