尽管人类对自然的探索已经达到“上九天揽月”、“下五洋捉鳖”的地步,但对于仅占人体总重量2%的大脑,却知之甚少。近年来,全球对于脑科学的研究如火如荼,脑科学研究正在不断打破人们的思维边界。神经拟态计算是对大脑研究的途径之一,可推动对人工智能(AI)和神经科学新领域的研究。
本文描述了澳大利亚正在进行的一个项目,该项目旨在构建一台大型神经形态计算机,其硬件可使用软件进行重配置。支持此类可配置硬件的主要技术是 FPGA,英特尔® FPGA 产品中包含的其他技术可帮助该项目扩展到与人类皮层中神经元和突触数量相当的规模。(完整方案内容请大家点击文末“阅读原文”获取)
神经拟态计算,为脑科学而来
西悉尼大学(WSU)的国际神经形态系统中心(ICNS)正计划建造一台与众不同的计算机 — 一种可扩展的神经形态计算系统,由通过高性能计算(HPC)网络结构互连的现场可编程门阵列(FPGA)组成。该项目的目标是,通过创建世界上第一台可配置的大脑级神经形态计算机,推动对人工智能(AI)和神经科学新领域的研究。
什么是大脑级计算?此概念旨在创建一个拥有与人类大脑皮层相当数量神经元和突触数量的计算环境。大脑皮层中的神经元数量估计在 100 亿到 200 亿之间,而突触数量更为庞大,在 60 到 240 万亿之间。大脑级计算的难点在于构建数量相当的人工神经元和突触,这一技术有望提供新的方法来研究生物大脑中的信息处理,包括在出现问题时,以及开发更出色的机器学习(ML)和人工智能技术。
神经形态计算是计算机科学的一个分支,专注于在硬件中真切模拟生物大脑的结构和功能,包括神经元、突触连接和尖峰信号。这是一个跨学科领域,需要深入了解生物学、计算机架构和机器学习。FPGA 是一种特殊的微芯片,其独特性在于支持使用软件在硬件层面进行配置和重配置,这为在同一硬件上实现不同模型以进行人工神经元组织提供了可能性。WSU 团队已经证明,在单个 FPGA 主板上使用 FPGA 进行神经形态计算的概念具备可行性,但这样的项目并没有大脑级实现先例。
一旦 WSU 成功构建了这种可配置的神经形态平台,神经形态硬件设计的研发必将迎来空前机遇,因为该平台支持在没有新硬件的情况下实现新设计,能够加快破解神经形态奥秘的步伐。
三方面的重大进展让这一项目露出曙光。首先是 WSU 进行的开创性研究和概念验证(PoC)。他们先是发现 FPGA 可以配置和可重配,能够模拟大脑皮层中不同种类的生物结构,然后一鼓作气,开发高效的核心与方法,以扩展到大量神经元。
其次,在最新一代的英特尔® Stratix® 10 FPGA 中,高带宽内存集成在 BittWare 520N-MX 主板上,从而提供了一种强大且经济的现成硬件平台。
最后,英特尔的可配置网络协议加速器(COPA)技术提供了一个高带宽和低延迟的接口,能够以高度可扩展的方式将大量 FPGA 连接在一起 — 由于过去没有这种能力,FPGA 无法大规模使用。COPA 可提供从 FPGA 到主机资源(如内存和硬盘)的简单编程访问,从而为将系统扩展至人类大脑大小创造了可能性(尽管会影响实时性能)。
本文讨论了神经形态计算这种新方法在促进 AI 突破和帮助人类深入了解大脑神经计算方面的光明前景。文中解释了 FPGA 的工作原理及其对加速神经形态研究进展的关键作用,描述了 COPA 和其他英特尔技术如何帮助 FPGA 在大脑级神经形态计算中释放强大能力。
如何利用 FPGA 进行神经形态计算?
ASIC 漫长的制造周期和严格的配置阻碍了技术发展。FPGA 支持硬件更新,有助于测试新理论和应用最新的发现成果。目标是创建一个基于现成硬件的开源解决方案,为研究人员和行业专业人士提供一个通用平台,以在更广泛的范围内执行受大脑启发的计算和发现。
FPGA 是可编程逻辑门的集成电路,与 CPU、GPU 或 ASIC 硬件不同,它可以使用软件进行配置和重配置。这很重要,因为人们还未完全揭开大脑神经元的组织奥秘 — 为实现这一目标,我们需要持续开展模拟实验。理论需要测试和完善;测试理论需要能够修改底层硬件。基于 FPGA 的神经形态计算为技术研究和发现提供了一个可配置的平台。
FPGA 的组件
WSU 完成的概念验证表明,FPGA 硬件的可编程性可用于探索高度复杂的神经形态计算模型。在 Mark Wang 的带领下,该团队使用 FPGA 可编程性模拟人类皮层中突触连接的层次模式,如上图所示。
神经形态计算系统的功能构建模块是一个稀疏连接的超级柱网络,每个超级柱由多达 128 个连接的微型柱组成,每个微型柱由 100 个紧密连接的神经元组成。
Wang 工作的独到之处在于将神经形态架构抽象化为由微型柱和超级柱表示的集群(如图 2 所示),类似于神经生物学中的基本结构单元。层次通信方案允许一个神经元从多达 200,000 个神经元中扇出,也就是说,一个神经元的输出可以作为多达 200,000 个其他神经元的输入。
概念验证以前在单个英特尔 Stratix V FPGA 上实现,它能够实时模拟具有多达 26 亿个 LIF 神经元的尖峰神经网络。当前项目将该平台扩展至三个服务器机架的 168 个英特尔 Stratix 10 MX FPGA,并将支持以每秒 86 万亿次突触操作的理论峰值性能模拟 SNN — 该速度与人类皮层每秒 20-118 万亿次突触操作的估计速度相当。这种规模依靠的不仅仅是 FPGA,而是众多先进的英特尔技术。