当全球AI的目光仍聚焦在那些吞噬万亿参数的庞大模型上时,一场围绕算力效率的变革已在底层代码中悄然启动。打造全球顶尖开源推理引擎 vLLM 的原班团队,今天正式宣布他们的野心:创立AI基础设施公司 Inferact,立志在AI推理这片尚待开垦的领域重塑规则。这不止是技术的升级,更是一份关于让人工智能真正走向实用的宣言。
资本市场对这位“含着金钥匙”出场的新秀几乎是狂热追捧。根据报道,Inferact 在种子轮融资中就以约 8 亿美元的估值,拿下了 1.5 亿美元的资金。这笔巨额融资背后的支持者名单,堪称全球顶级权力的缩影:由风投巨头 Andreessen Horowitz 与光速创投领投,红杉资本、Altimeter Capital、红点创投以及真格基金等知名机构悉数到场,共同为这台未来的推理引擎注入强劲动能。

在开源社区里,vLLM 早已在开发者心中留下深刻印记。它凭借一套引擎支撑了 500 多种模型架构,在 200 多种硬件加速器上都能顺畅运行,并成功扛起全球规模的推理任务。而 Inferact 的目标更宏大也更明确:要把 vLLM 推到世界领先的位置,真正打破高昂的推理成本,用极致的速度让 AI 的能力流向每一个计算节点。
在 AI 发展的长河里,如果说训练更像是漫长的“闭门造车”,那推理就是走向用户的实战检验。随着大模型应用快速铺开,推理阶段对算力的消耗正滚雪球般上涨,已成为商业化能否跑通的关键命门。Inferact 的登场,意味着行业重心正在从昂贵的训练场转向高效的部署战场。这既证明了开源技术在商业中的巨大张力,也显示 AI 基础设施竞争已进入追求极致效能的下半场。
用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?