IBM研究中心推出NorthPole运行速度比当前芯片产品快22倍

2023-10-25 17:10:11
导读 该消息来自《科学》杂志上发表的一篇论文,其中讨论了IBM即将推出的代号为NorthPole的AI加速器。随着业界AI热潮的涌入,不少芯片厂商纷纷打...

该消息来自《科学》杂志上发表的一篇论文,其中讨论了IBM即将推出的代号为NorthPole的AI加速器。随着业界“AI热潮”的涌入,不少芯片厂商纷纷打造自己的解决方案,唯一的目的就是超越行业领先者的计算性能,满足不断增长的AI需求。

相关故事超越人工智能:随着IBM展示其量子技术的有用应用,量子计算时代即将来临

IBM研究院发布的新数据暗示“NorthPole”人工智能芯片将在行业内树立新的基准,特别是因为该公司的人工智能芯片方法确实令人着迷。

项目负责人DharmendraModha对芯片架构非常乐观。现在,IBMResearch的实现是,该公司将神经推理架构结合到芯片处理本身中,这就是Modha将其归类为“人脑”的原因。其高效的CPU互连性与全数字架构相结合,可以更快地实现相互通信,这就是NorthPole输出如此性能的原因。

说到规格,NorthPole采用12nm节点处理技术,从行业角度来看,该技术相当古老,但IBMResearch认为,由于使用了ResNet-50神经网络,该芯片也超越了现代4nmAIGPU模型。这一成就也否定了摩尔定律,并且在某种程度上遵循了黄氏定律的核心要素,即关注单个芯片堆栈而不是工艺缩小。

从架构上来说,NorthPole模糊了计算和内存之间的界限。在单个核心的层面上,NorthPole表现为近计算内存,而从芯片外部来看,在输入输出层面上,它表现为主动内存。这使得NorthPole易于集成到系统中,并显着减少主机上的负载

北极芯片的第一组有希望的结果今天发表在《科学》杂志上。Modha表示,NorthPole是芯片架构方面的一项突破,可大幅提高能源、空间和时间效率。以ResNet-50模型为基准,NorthPole的效率明显高于常见的12纳米GPU和14纳米CPU。(NorthPole本身基于12nm节点处理技术构建。)在这两种情况下,就每焦耳所需功率解释的帧数量而言,NorthPole的能效提高了25倍。就每十亿个晶体管所需的每秒解释帧数而言,NorthPole在延迟和计算所需空间方面也表现出色。

Modha表示,在ResNet-50上,NorthPole的性能优于所有主要流行架构,甚至是那些使用更先进技术工艺的架构,例如使用4nm工艺实现的GPU。

如果我们看NorthPole对整个人工智能行业的潜在影响,它肯定仅限于“模型推理”,因为该芯片缺乏对GPT-4等大规模神经网络的支持。不过,该公司推出该芯片的目标并非针对主流人工智能市场,而是针对那些只专注于推理的市场,因此其影响力有限。鉴于NorthPole声称它也可以超越现代NVIDIAAI产品,因此看看NorthPole能够输出什么样的性能将会很有趣。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。