Intel正式推出了其最新一代的大型神经拟态研究系统,代号为“Hala Point”。该系统专为类脑AI领域前沿研究而设计,旨在显著提升AI处理的效率和可持续性。
基于Intel Loihi 2神经拟态处理器,Hala Point在Intel先前的Pohoiki Springs系统上做了进一步的架构改进。这些优化使得系统的神经元容量激增至11.5亿个,这是其前代系统容量的十倍以上,性能亦得到了高达12倍的提升。
Loihi 2处理器于2021年发布,是首个采用Intel 4工艺的产品,集成了230亿个晶体管、六个低功耗x86核心及128个神经形态核心。每个处理器包含100万个神经元和1.2亿个突触,这比上一代的规模大8倍,性能提升了10倍。
Loihi 2利用了众多类脑计算原则,例如异步操作、基于事件的脉冲神经网络(SNN)以及存算一体的稀疏连接。这些特性允许神经元之间直接通信,无需通过内存进行中转。
在新兴的边缘工作负载方面,尤其是小规模的场景下,Loihi 2实现了数量级的效率、速度和适应性提升。比如,在执行AI推理负载和处理优化问题时,其速度比传统CPU和GPU快达50倍,同时能耗仅为后者的百分之一。
Hala Point系统的物理形态是一个六机架数据中心机箱,体积相当于一个微波炉大小。它内部装有1152颗Loihi 2处理器,共计140,544个神经形态处理内核、11.5亿个神经元及1280亿个突触,而最大功耗仅为2600瓦。
系统还包括了2300多颗嵌入式x86处理器以辅助计算。它具有极高的内存带宽,达到了16PB/s(即16000TB/s),内核间通信带宽为3.5PB/s(3500TB/s),芯片间通信带宽为5TB/s。这使得系统能够每秒处理超过380万亿次的8位突触运算和超过240万亿次的神经元运算。
在主流AI工作负载方面,Hala Point展现了卓越的计算效率。运行传统深度神经网络时,它能每秒完成多达2万万亿次运算(20PFlops),在8位运算中的能效比达到了15TOPS/W(每瓦特15万亿次计算),这个表现甚至超越了现有的基于GPU和CPU的架构。
特别值得一提的是,Hala Point在仿生脉冲神经网络模型的运行上,能以比人脑快20倍的速度实时运行其全部11.5亿个神经元。在处理较低神经元数量的任务时,速度甚至可以比人脑快200倍。
初步研究结果显示,Hala Point通过利用高至10比1的稀疏连接和事件驱动的活动,可以在不进行输入数据批处理的情况下,实现运行深度神经网络的高能效比,达到15TOPS/W。