奥数金牌档推理!谷歌发布升级版 Gemini 3 Deep Think:专攻科研,成绩逼近“人类最后考试”

大模型正从“聊天帮手”走向能做研究的“科学型助手”。2026年2月13日,谷歌官宣对 Gemini3Deep Think 深度思考模型进行重大升级。它不再只聚焦日常对话,而是面向科学、研究与工程等更看重严密逻辑推理的领域。

科研“推理模式”:直面无唯一解的难题

新版 Deep Think 由谷歌团队与顶尖科学家紧密合作打造,专为真实科研中的痛点而来:

应对复杂环境:面向边界不清、缺少唯一标准答案、且数据不完整且嘈杂的问题进行了深度优化。

扩大开放范围:自2月12日起,Google AI Ultra订阅用户可在应用内直接体验。

开发者尝鲜:谷歌首次通过 Gemini API 向部分研究人员与企业开放“早期访问计划”。

战绩亮眼:横扫奥赛与职业基准

奥数金牌水平:在2025年国际数学奥林匹克(IMO)测试中达到金牌档表现,物理与化学奥赛笔试同获金牌级评价。

逼近人类极限:在“人类最后考试”(Humanity’s Last Exam)取得48.4%的成绩。

编程天花板:在 Codeforces 竞赛编程基准上拿到3455 Elo,展现出强劲的算法与工程建模实力。

从“刷榜”到“落地”:实验室里的数字助手

谷歌强调,Deep Think 的目标不只是漂亮的基准分数,更要真正走进实验室:

助力工程建模:帮助工程师以代码对复杂物理系统进行高精度建模与验证。

深度数据分析:协助科研人员解释、关联并挖掘体量庞大且分散的科学数据。

随着 Gemini3Deep Think 全面介入,AI 正在从单纯的效率工具进化为科研创新的“合作伙伴”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享