AI 助手的终局进化:Gemini 任务自动化内测开启,手机开始替你跑腿

谷歌长期描绘的 AI 蓝图,随着的亮相,终于落地。今日,联合宣布,基于 Gemini 的“任务自动化”功能已进入 Beta 内测阶段。这意味着 AI 助手从纯粹的“信息查询员”升级为可跨应用执行操作的“数字代办”,能仿照人类在手机上的一系列操作,把订餐、打车等复杂流程跑通。

image.png

视觉冲击:看着手机“自己操作自己”

不同于传统的 API 对接, 的自动化会在一个虚拟窗口里还原真实用户的点击与滑动:

  • 智能打车:当你下达“打车去机场”的指令, 会自动唤起 Uber,询问并确认具体航站楼(遇到多航站楼会先提问),随后自动填入目的地。

  • 代订餐食:收到“帮我点一杯咖啡和牛角包”的需求后,AI 会自主滑动页面,定位星巴克菜单中的指定饮品(如 Flat White),还能像真人一样处理复杂的滚动与选择。

安全机制:关键一步由人来定夺

为降低自主操作带来的风险,谷歌在整个自动化流程中加入了严格的人工复核设计:

显式操作:用户可实时看到 的每一步动作,并可随时通过“Take control”接管或终止流程。

最后确认制:在真正提交订单或支付前,系统会停在支付页面,等待用户核对明细并手动点击“确认”,确保每一笔交易都在可控范围内完成。

目前,该能力已优先适配外卖配送与网约车类应用。对于及后续用户而言,手机不再只是运行 App 的载体,而是能理解自然语言并把意图转成具体操作的“超级代理”。

尽管 AI 在菜单滚动与选项识别上偶尔还会有些“笨拙”,但这种无需深度 API 适配、直接基于 UI 交互的自动化模式,显著拓宽了 AI 助手的应用边界。随着算法不断迭代,我们正告别“在 App 丛林里反复切换”的时代,迈向“一句话搞定琐事”的真智能阶段。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享