近日,Zoom 视频通讯公司称,其人工智能系统在一项名为 “人类最后考试”(Humanity’s Last Exam)的测试中拿到 48.1% 的新高,超过谷歌 Gemini3Pro 先前 45.8% 的成绩。这一消息在技术圈引发关注与讨论。
Zoom 的首席技术官黄学东在博客表示,公司并未自行训练大型语言模型,而是采用“联合 AI”的做法,把来自 OpenAI、谷歌和 Anthropic 的多个现有模型联合起来。Zoom 构建了一个名为 “Z 评分器” 的系统,用来评估不同模型的回答并挑选最优输出。这个系统通过 “探索 – 验证 – 联合” 的策略,整合多种模型的能力。
不过,业内反应不一。一些 AI 专家质疑 Zoom 的方案,认为这只是把 API 接口拼接起来,并无实质创新。比如,AI 工程师 Max Rumpf 表示,Zoom 没有做模型训练,却称自己打造了 “前沿技术”。他认为,这样的说法模糊了事实,也削弱了其他模型开发者的努力。
也有不同声音认为,Zoom 的路径属于行业内的最优实践,类似 Kaggle 竞赛中通过模型集成拿到好名次。还有观点指出,这一成果展示了企业级 AI 的未来方向:与其追求做出最强大的单一模型,不如把多模型的长处结合起来。
这种策略既能降低对单一模型依赖带来的风险,也有望为用户提供更匹配的 AI 方案。接下来,随着 Zoom 在 AI 上的推进,用户将通过 AI Companion3.0的功能来检验其实际价值与效果。
划重点:
🌟 Zoom 在 “人类最后考试” 中取得 48.1% 的新高,超过谷歌的纪录。
🤖 公司采用 “联合 AI” 方法,整合多家现有模型来实现能力。
💡 业内看法分化,有人批评缺少创新,也有人称其为行业最优实践。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?