近日,开源浏览器自动化项目 BrowserUse 推出其首个自研大语言模型——BU-30B-A3B-Preview。模型一上线便引发热议,被誉为 Web Agent(网页代理)领域的新标杆,凭借超强的性价比与实时响应速度,显著降低了 AI 浏览器操作的使用门槛。
模型架构:MoE 设计,实现“脑力强、体量轻”
BU-30B-A3B-Preview 采用混合专家(MoE)架构,总参数规模为 30B(300 亿),但推理时仅激活 3B(30 亿)参数。这样一来,模型在保持旗舰级智能表现的同时,大幅降低资源消耗,单张消费级 GPU 就能顺畅运行。
该模型基于阿里云通义千问 Qwen3-VL-30B-A3B-Instruct 深度微调,专注浏览器自动化场景优化,支持图文多模态输入,上下文可达 32K tokens,轻松应对复杂且内容较长的网页。

核心能力:强大的 DOM 理解与视觉推理
在浏览器操作任务中,BU-30B-A3B-Preview 表现优异,具备完整的网页交互能力,包括精准元素定位、点击、滚动、表单填写等。其对 DOM(文档对象模型)的深入理解与视觉推理能力,让代理像人类一样“看懂”页面结构与截图,自动化执行更加稳定可靠。
官方表示,该模型尤其适合构建 Web Agent 应用,如自动化测试、数据采集、RPA 流程等,内部基准测试结果显示已处于行业领先水平。
性能亮点:速度快、成本低的双重优势
官方对比数据显示,BU-30B-A3B-Preview 在任务速度与经济性方面明显优于主流商用模型:
– 单步平均用时约 1.2 秒,整体任务完成效率显著提升。
– 成本友好:每 1 美元计算资源可稳定完成约 200 个浏览器任务,较部分竞品高出数十倍。
得益于更小的推理体量(适合单 GPU 部署),开发者可轻松在本地下载测试,无需支付高昂的云端费用。
开源意义:推动 Web Agent 生态加速进化
BU-30B-A3B-Preview 已全面开源,模型权重已上传至 Hugging Face,开发者可免费获取并集成到 BrowserUse 开源库中。这意味着浏览器自动化迈入“高效开源时代”,将促使更多创新应用快速落地。
编辑点评 BU-30B-A3B-Preview 的发布,精准解决了传统大模型在浏览器任务中“贵且慢”的痛点。对于需要大规模网页自动化的团队与开发者而言,它是一款性价比超高的选择。随着社区持续优化,模型有望成为 Web Agent 领域的常用配置。感兴趣的读者不妨前往 Hugging Face 下载试用。
地址:https://huggingface.co/browser-use/bu-30b-a3b-preview


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?