谷歌 Gemini 上线“代操作”功能：手机开始自己下外卖了-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

AI 助手正从“只说不做”迈向“替你上手”。

近日，谷歌正式在 Pixel10Pro 和 Galaxy S26Ultra 上发布 Gemini 的任务自动化功能（Task Automation）。这意味着 AI 助手从“聊天工具”升级为“执行代理（Agent）”，不只会答疑，还能直接接管你的手机屏幕替你完成操作。

上手体验：完全“自动驾驶”，只是得等一等

据 OSCHINA 的实测显示，想在 DoorDash 下单外卖，只需对 Gemini 用自然语言发出指令，后续流程可谓“像在看科幻片”:

后台代操: AI 会自行打开 App、识别页面元素、填写表单并勾选选项，最终完成订单确认。

异步运行: 执行期间，屏幕底部会实时显示“正在选择目的地”等进度。更妙的是，你可以切去刷视频或回邮件，AI 会在后台持续处理直到搞定任务。

速度瓶颈: 目前的短板是“慢”。由于需要逐帧理解界面并进行云端推理，人手2分钟能办完的事，AI 可能要花到9分钟。

技术突围: 终结“只做信息查询”的十年天花板

这十年里，从 Siri 到 Google Assistant，语音助手多停留在设闹钟、看天气等浅层互动。Gemini 任务自动化的关键突破在于具备复杂的长链任务规划能力，让“发出指令—等待结果”真正可行。

生态限制: 目前还是“概念级”

尽管前景诱人，但当下的自动化功能仍面临不少挑战:

适配面小: 暂时只覆盖 Uber、DoorDash 等流程高度标准化的应用。

容错还需提高: 一旦界面识别出错，或在支付环节触发安全限制，就可能被卡住，影响大规模普及。

巨头交锋: 2026 或将成为“AI 代理”元年

随着 OpenAI 的 Operator 和苹果 Apple Intelligence 相继发力，谷歌率先把功能落地到移动端，意在借助 Android 生态占据高频生活场景。

当下的 Gemini 任务自动化看上去还有点“笨拙”，但技术常走的是指数曲线。等到 AI 能以人类速度顺畅操作任意 App，我们和手机的交互方式将被彻底重塑。这场“慢却很酷”的进化，是通往通用人工智能（AGI）的关键一步。

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

谷歌 Gemini 上线“代操作”功能：手机开始自己下外卖了