谷歌 Gemini 上线“代操作”功能:手机开始自己下外卖了

AI 助手正从“只说不做”迈向“替你上手”。

近日,谷歌 正式在 Pixel10ProGalaxy S26Ultra 上发布 Gemini 的任务自动化功能(Task Automation)。这意味着 AI 助手从“聊天工具”升级为“执行代理(Agent)”,不只会答疑,还能直接接管你的手机屏幕替你完成操作。

上手体验:完全“自动驾驶”,只是得等一等

OSCHINA 的实测显示,想在 DoorDash 下单外卖,只需对 Gemini 用自然语言发出指令,后续流程可谓“像在看科幻片”:

后台代操: AI 会自行打开 App、识别页面元素、填写表单并勾选选项,最终完成订单确认。

异步运行: 执行期间,屏幕底部会实时显示“正在选择目的地”等进度。更妙的是,你可以切去刷视频或回邮件,AI 会在后台持续处理直到搞定任务。

速度瓶颈: 目前的短板是“慢”。由于需要逐帧理解界面并进行云端推理,人手2分钟能办完的事,AI 可能要花到9分钟。

技术突围: 终结“只做信息查询”的十年天花板

这十年里,从 Siri 到 Google Assistant,语音助手多停留在设闹钟、看天气等浅层互动。Gemini 任务自动化的关键突破在于具备复杂的长链任务规划能力,让“发出指令—等待结果”真正可行。

生态限制: 目前还是“概念级”

尽管前景诱人,但当下的自动化功能仍面临不少挑战:

适配面小: 暂时只覆盖 Uber、DoorDash 等流程高度标准化的应用。

容错还需提高: 一旦界面识别出错,或在支付环节触发安全限制,就可能被卡住,影响大规模普及。

巨头交锋: 2026 或将成为“AI 代理”元年

随着 OpenAI 的 Operator 和苹果 Apple Intelligence 相继发力,谷歌 率先把功能落地到移动端,意在借助 Android 生态占据高频生活场景。

当下的 Gemini 任务自动化看上去还有点“笨拙”,但技术常走的是指数曲线。等到 AI 能以人类速度顺畅操作任意 App,我们和手机的交互方式将被彻底重塑。这场“慢却很酷”的进化,是通往通用人工智能(AGI)的关键一步。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享