AI现在真的会“动手”了!Vercel推出Agent Browser,让大模型直接操作网页:

AI Agent 的能力边界正在被重新定义。近日,前端开发平台 Vercel 正式发布 Agent Browser——一款专为 AI 代理打造的浏览器自动化命令行工具(CLI),首次让大模型“不仅能看懂网页,还能亲自上手操作”。这意味着,未来的 AI 不再只会分析和回答,而是能像人类一样点击、填写、提交,甚至独立完成整套线上流程。

零配置上手,开发者友好

Agent Browser 的最大看点是极致简单易用:无需手动安装浏览器驱动或配置繁琐依赖,装好就能用。开发者只需通过几条简单命令,就能让 AI 代理和真实网页环境互动。工具提供两种运行方式——既可在可视化浏览器中实时调试,便于观察 AI 的具体行为;也能在后台静默执行批量任务,适合自动化测试、数据采集或流程机器人等场景。

G-gVcY0bsAER8HW.jpg

轻量高效,专为AI优化

针对传统浏览器自动化工具(如 Playwright)在向 AI 提供网页信息时上下文冗长、效率偏低的问题,Agent Browser 做了深度优化。它对数据结构进行瘦身,最多可减少 93% 的无关上下文,只把关键 DOM 信息与可操作元素交给 AI,大幅提升推理速度与准确性。同时,底层采用 Rust 编写,相比基于 Node.js 或 Python 的常见方案,启动更快、资源占用更小、运行更稳定。

广泛兼容主流AI生态

Agent Browser 具备很强的开放性,目前已全面兼容 Claude Code、Gemini、Cursor、GitHub Copilot、Codex、opencode 等主流 AI 编程助手,并支持任何能运行 Bash 命令的操作系统。也就是说,无论你使用哪款 AI 工具,都能无缝集成 Agent Browser,快速构建具备“动手能力”的智能代理。

这款工具的推出,标志着 AI 正从“被动理解”迈向“主动执行”的关键一步。当 AI 能自主完成订票、填表、比价,甚至测试自家网站,人机协作的方式将被彻底改变。Vercel 正以 Agent Browser 为支点,推动下一代 AI 原生应用的开发浪潮。

项目地址:https://github.com/vercel-labs/agent-browser

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享