xAI推出Grok4.20:推理能力大幅进步,78%不幻觉率创下新高

2026年3月12日,xAI官宣推出新一代大语言模型Grok4.20Beta。在价格依旧具备竞争力的前提下,它凭借非常高的事实可信度刷新了业内纪录。

依据Artificial Analysis最新测评,Grok4.20在启用推理功能的智能指数(Intelligence Index)中拿到48分,比上代提升6分。虽然在综合基准上仍与Gemini3.1Pro PreviewGPT-5.4(两者均为57分)存在差距,但其在AA全知测试中的表现十分亮眼,不幻觉率高达78%,对模型编造信息的问题形成了有效抑制。

QQ20260313-091756.jpg

在产品矩阵与工程参数方面,xAI同步推出了带推理功能、不带推理功能以及多智能体模式三种API版本。该模型支持最高200万个令牌的上下文窗口;定价更具渗透力,每百万令牌仅2至6美元,相较Grok4明显下探。技术层面,Grok4.20在面对不确定领域时更愿意明确表示“不了解”,整体错误率降至约五分之一。

Grok、马斯克、xAI

全球大模型的竞争已从单看参数规模,转向同时比拼推理深度与事实准确性。Grok4.20的推出,意味着xAI在通往通用人工智能(AGI)的过程中,正以更“诚实”的回答与更低的幻觉率打造差异化优势。对事实可靠性的极致追求,不仅提升其在严谨行业场景的落地潜力,也为未来多智能体协作提供了更稳固的信任基础。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享