正文:
全球 AI 芯片竞争不断升温之际,初创公司 Positron 正式发布全新 AI 推理芯片 Asimov。官方称这款面向大模型(LLM)推理深度优化的芯片,在能效比(每瓦特能产出多少 Token)与性价比(每美元能产出多少 Token)两项关键指标上,目标达到英伟达下一代 Rubin 架构的 5 倍,这一大胆表述迅速引发业界关注。
Positron 的思路是对传统 GPU 做“减法”。Asimov 删去通用计算卡里繁复的控制逻辑,改用更纯粹的张量处理架构,尽量把能量从非计算环节的浪费中收回来,力求最大化计算效率。这样的设计让同规模模型的功耗更低,也显著压缩芯片制造与封装成本。团队表示,在当下数据中心电力紧张的大背景下,这种极致的能效将成为企业上线 AI 服务的关键因素。
当然,想要撼动英伟达的市场地位并不容易。Positron 正在打造配套编译器与开发生态,力求让开发者可以顺畅迁移现有的 PyTorch 或 TensorFlow 模型。Asimov 采用先进制程,并围绕主流 Transformer 架构做了硬件级优化,目标是在面对万亿参数模型时,依旧保持高吞吐与低时延。
业内观点认为,Positron 的入场体现了 AI 芯片从“通用算力”向“专用推理”转型的趋势。如果 Asimov 真能兑现“效能提升 5 倍”的承诺,或将重塑大模型推理的成本格局。
划重点:
-
🚀 能效巅峰挑战: Asimov 宣称在每瓦特与每美元的 Token 产出上,相比英伟达未来 Rubin 架构可达 5 倍,主打极致性价比。
-
🏗️ 架构精简革新: 削减通用计算中的冗余模块,专注张量计算的专用架构,显著降低推理阶段的能量损耗与硬件成本。
-
🌐 瞄准大规模推理: 硬件深度优化 Transformer,旨在解决万亿参数模型落地时的电力瓶颈与高昂运营费用。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?