AI开始会“亲自上手”!Vercel推出Agent Browser,让大模型直接操控网页

AI Agent的能力边界正在被重塑。近日,前端开发平台Vercel正式发布Agent Browser——一款为AI代理打造的浏览器自动化命令行工具(CLI),首度让大模型“不仅能看懂网页,还能自己动手操作”。这意味着,未来的AI不再只会分析和回答,而是能像真人一样去点击、填写、提交,甚至把整套在线任务完成。

零配置上手,开发者友好

Agent Browser的最大看点是极致好用:无需手动安装浏览器驱动或配置繁琐依赖,装好就能用。开发者只需通过简单命令,就能让AI代理与真实网页环境互动。工具支持两种运行模式——既可在可视化浏览器中实时调试,方便观察AI的操作;也可在后台静默执行批量任务,适用于自动化测试、数据采集或流程机器人等场景。

G-gVcY0bsAER8HW.jpg

轻量高效,专为AI优化

针对传统浏览器自动化工具(如Playwright)在向AI传递网页信息时上下文冗长、效率不佳的痛点,Agent Browser做了深度优化。其数据结构经过精简,可减少高达93%的无关上下文,只向AI提供关键DOM信息与可操作元素,显著提升推理效率与准确性。同时,底层采用Rust开发,相较于基于Node.js或Python的常见方案,启动更快、资源更省、运行更稳。

广泛兼容主流AI生态

Agent Browser开放性十足,目前已全面兼容Claude Code、Gemini、Cursor、GitHub Copilot、Codex、opencode等主流AI编程助手,并支持任何可运行Bash命令的操作系统。这意味着,不论开发者使用哪款AI工具,都能无缝接入Agent Browser,快速构建具备“动手能力”的智能代理。

这次发布,标志着AI从“被动理解”迈向“主动执行”的关键一步。当AI能自主完成订票、填表、比价,甚至测试自家网站,人机协作的范式将迎来重大变革。Vercel正以Agent Browser为支点,推动下一代AI原生应用的开发浪潮。

项目地址:https://github.com/vercel-labs/agent-browser

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享