能效比直指 Rubin 的 5 倍?初创 Positron 推出 Asimov,重塑 AI 大模型推理

正文:

全球 AI 芯片竞争不断升温之际,初创公司 Positron 正式发布全新 AI 推理芯片 Asimov。官方称这款面向大模型(LLM)推理深度优化的芯片,在能效比(每瓦特能产出多少 Token)与性价比(每美元能产出多少 Token)两项关键指标上,目标达到英伟达下一代 Rubin 架构的 5 倍,这一大胆表述迅速引发业界关注。

Positron 的思路是对传统 GPU 做“减法”。Asimov 删去通用计算卡里繁复的控制逻辑,改用更纯粹的张量处理架构,尽量把能量从非计算环节的浪费中收回来,力求最大化计算效率。这样的设计让同规模模型的功耗更低,也显著压缩芯片制造与封装成本。团队表示,在当下数据中心电力紧张的大背景下,这种极致的能效将成为企业上线 AI 服务的关键因素。

当然,想要撼动英伟达的市场地位并不容易。Positron 正在打造配套编译器与开发生态,力求让开发者可以顺畅迁移现有的 PyTorch 或 TensorFlow 模型。Asimov 采用先进制程,并围绕主流 Transformer 架构做了硬件级优化,目标是在面对万亿参数模型时,依旧保持高吞吐与低时延。

业内观点认为,Positron 的入场体现了 AI 芯片从“通用算力”向“专用推理”转型的趋势。如果 Asimov 真能兑现“效能提升 5 倍”的承诺,或将重塑大模型推理的成本格局。

划重点:

  • 🚀 能效巅峰挑战: Asimov 宣称在每瓦特与每美元的 Token 产出上,相比英伟达未来 Rubin 架构可达 5 倍,主打极致性价比。

  • 🏗️ 架构精简革新: 削减通用计算中的冗余模块,专注张量计算的专用架构,显著降低推理阶段的能量损耗与硬件成本。

  • 🌐 瞄准大规模推理: 硬件深度优化 Transformer,旨在解决万亿参数模型落地时的电力瓶颈与高昂运营费用。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享