近日在 Axios AI + 峰会现场,Google DeepMind CEO 德米斯・哈萨比斯(Demis Hassabis)谈到了他对未来一年的 AI 趋势判断。他认为,2026 年将成为多模态模型、交互式视频世界以及更稳健的 AI 代理加速突破的关键节点。
哈萨比斯指出,DeepMind 的最新 AI 模型“Gemini”在多模态上已有明显跃升。它不只会复述剧情,还能把握场景背后的含义。比如在电影《搏击俱乐部》中,AI 能把角色摘下戒指这一动作理解为对日常生活的一种哲学式放弃。凭借这种更深的理解,AI 还能产出更复杂的内容,如信息图等,这是过去的技术难以做到的。
他补充说,AI 代理将在一年内将“接近”具备独立完成复杂任务的能力,这与他在 2024 年 5 月给出的时间表一致。DeepMind 正致力于打造一款跨设备的通用助手,协助用户处理日常事务。为此,团队也在开发名为“Genie 3”的“世界模型”,可生成可互动、可探索的视频空间,让用户沉浸式体验虚拟世界。
划重点:
🌟 多模态突破将进一步提升 AI 对复杂内容的理解与生成能力。
🛠️ AI 代理很快将逼近可独立处理复杂任务的水平。
🌍 DeepMind 正推进互动视频空间,为用户带来全新沉浸式体验。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?