近日,视频通信公司 Zoom 表示,其 AI 系统在“人类最后考试”(Humanity’s Last Exam)评测中拿下 48.1% 的最高分,打破谷歌 Gemini3Pro 以 45.8% 保持的纪录。消息公布后,科技圈随即展开广泛讨论。
Zoom 的首席技术官黄学东在博文中称,公司并未自行训练大型语言模型,而是采取“联合 AI”的路径,整合来自 OpenAI、谷歌与 Anthropic 的多种现成模型。Zoom 搭建了名为“Z 评分器”的系统,用于评估不同模型的回答并挑选最佳输出;其方法论为“探索 – 验证 – 联合”,以汇聚多模型能力。
不过,行业反应并不一致。部分 AI 专家质疑,Zoom 的做法更像是把多家 API 简单拼接,缺少真正的创新。AI 工程师 Max Rumpf 指出,Zoom 并未进行模型训练,却声称推出“最先进的技术”,这在他看来模糊了事实,也降低了其他模型研发者的贡献。
也有评论者认可这一路线,认为其符合行业最佳实践,类似在 Kaggle 竞赛中通过集成策略取胜。还有观点指出,这展示了企业级 AI 的未来方向:与其单点追求打造最强的单一模型,不如把多个模型的长处有机结合。
从风险与效果看,这种策略既能降低对单一模型依赖的隐患,也更易为用户匹配更合适的 AI 方案。随着 Zoom 持续推进相关能力,用户将可通过其 AI Companion3.0 的功能来检验实际价值与表现。
划重点:
🌟 Zoom 在“人类最后考试”中拿到 48.1% 的最高分,超越谷歌的纪录。
🤖 其路径为“联合 AI”,通过整合多家现有模型来实现能力。
💡 业内观点分化:有人批评创新不足,也有人认为这是行业最佳实践。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?