AI 助手正从“只说不做”迈向“替你上手”。
近日,谷歌 正式在 Pixel10Pro 和 Galaxy S26Ultra 上发布 Gemini 的任务自动化功能(Task Automation)。这意味着 AI 助手从“聊天工具”升级为“执行代理(Agent)”,不只会答疑,还能直接接管你的手机屏幕替你完成操作。
上手体验:完全“自动驾驶”,只是得等一等
据 OSCHINA 的实测显示,想在 DoorDash 下单外卖,只需对 Gemini 用自然语言发出指令,后续流程可谓“像在看科幻片”:
后台代操: AI 会自行打开 App、识别页面元素、填写表单并勾选选项,最终完成订单确认。
异步运行: 执行期间,屏幕底部会实时显示“正在选择目的地”等进度。更妙的是,你可以切去刷视频或回邮件,AI 会在后台持续处理直到搞定任务。
速度瓶颈: 目前的短板是“慢”。由于需要逐帧理解界面并进行云端推理,人手2分钟能办完的事,AI 可能要花到9分钟。
技术突围: 终结“只做信息查询”的十年天花板
这十年里,从 Siri 到 Google Assistant,语音助手多停留在设闹钟、看天气等浅层互动。Gemini 任务自动化的关键突破在于具备复杂的长链任务规划能力,让“发出指令—等待结果”真正可行。
生态限制: 目前还是“概念级”
尽管前景诱人,但当下的自动化功能仍面临不少挑战:
适配面小: 暂时只覆盖 Uber、DoorDash 等流程高度标准化的应用。
容错还需提高: 一旦界面识别出错,或在支付环节触发安全限制,就可能被卡住,影响大规模普及。
巨头交锋: 2026 或将成为“AI 代理”元年
随着 OpenAI 的 Operator 和苹果 Apple Intelligence 相继发力,谷歌 率先把功能落地到移动端,意在借助 Android 生态占据高频生活场景。
当下的 Gemini 任务自动化看上去还有点“笨拙”,但技术常走的是指数曲线。等到 AI 能以人类速度顺畅操作任意 App,我们和手机的交互方式将被彻底重塑。这场“慢却很酷”的进化,是通往通用人工智能(AGI)的关键一步。
用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?