xAI推出Grok4.20：推理能力大幅进步，78%不幻觉率创下新高-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

xAI推出Grok4.20：推理能力大幅进步，78%不幻觉率创下新高

拥抱AI，AIGC最佳实践者

576

2026年3月12日，xAI官宣推出新一代大语言模型Grok4.20Beta。在价格依旧具备竞争力的前提下，它凭借非常高的事实可信度刷新了业内纪录。

依据Artificial Analysis的最新测评，Grok4.20在启用推理功能的智能指数（Intelligence Index）中拿到48分，比上代提升6分。虽然在综合基准上仍与Gemini3.1Pro Preview和GPT-5.4（两者均为57分）存在差距，但其在AA全知测试中的表现十分亮眼，不幻觉率高达78%，对模型编造信息的问题形成了有效抑制。

在产品矩阵与工程参数方面，xAI同步推出了带推理功能、不带推理功能以及多智能体模式三种API版本。该模型支持最高200万个令牌的上下文窗口；定价更具渗透力，每百万令牌仅2至6美元，相较Grok4明显下探。技术层面，Grok4.20在面对不确定领域时更愿意明确表示“不了解”，整体错误率降至约五分之一。

Grok、马斯克、xAI

全球大模型的竞争已从单看参数规模，转向同时比拼推理深度与事实准确性。Grok4.20的推出，意味着xAI在通往通用人工智能（AGI）的过程中，正以更“诚实”的回答与更低的幻觉率打造差异化优势。对事实可靠性的极致追求，不仅提升其在严谨行业场景的落地潜力，也为未来多智能体协作提供了更稳固的信任基础。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐