1美元搞定200个浏览器任务！开源浏览器操控利器 BU-30B-A3B-Preview 重磅发布-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，开源浏览器自动化项目 BrowserUse 推出其首个自研大语言模型——BU-30B-A3B-Preview。模型一上线便引发热议，被誉为 Web Agent（网页代理）领域的新标杆，凭借超强的性价比与实时响应速度，显著降低了 AI 浏览器操作的使用门槛。

模型架构：MoE 设计，实现“脑力强、体量轻”

BU-30B-A3B-Preview 采用混合专家（MoE）架构，总参数规模为 30B（300 亿），但推理时仅激活 3B（30 亿）参数。这样一来，模型在保持旗舰级智能表现的同时，大幅降低资源消耗，单张消费级 GPU 就能顺畅运行。

该模型基于阿里云通义千问 Qwen3-VL-30B-A3B-Instruct 深度微调，专注浏览器自动化场景优化，支持图文多模态输入，上下文可达 32K tokens，轻松应对复杂且内容较长的网页。

核心能力：强大的 DOM 理解与视觉推理

在浏览器操作任务中，BU-30B-A3B-Preview 表现优异，具备完整的网页交互能力，包括精准元素定位、点击、滚动、表单填写等。其对 DOM（文档对象模型）的深入理解与视觉推理能力，让代理像人类一样“看懂”页面结构与截图，自动化执行更加稳定可靠。

官方表示，该模型尤其适合构建 Web Agent 应用，如自动化测试、数据采集、RPA 流程等，内部基准测试结果显示已处于行业领先水平。

性能亮点：速度快、成本低的双重优势

官方对比数据显示，BU-30B-A3B-Preview 在任务速度与经济性方面明显优于主流商用模型：

– 单步平均用时约 1.2 秒，整体任务完成效率显著提升。

– 成本友好：每 1 美元计算资源可稳定完成约 200 个浏览器任务，较部分竞品高出数十倍。

得益于更小的推理体量（适合单 GPU 部署），开发者可轻松在本地下载测试，无需支付高昂的云端费用。

开源意义：推动 Web Agent 生态加速进化

BU-30B-A3B-Preview 已全面开源，模型权重已上传至 Hugging Face，开发者可免费获取并集成到 BrowserUse 开源库中。这意味着浏览器自动化迈入“高效开源时代”，将促使更多创新应用快速落地。

编辑点评 BU-30B-A3B-Preview 的发布，精准解决了传统大模型在浏览器任务中“贵且慢”的痛点。对于需要大规模网页自动化的团队与开发者而言，它是一款性价比超高的选择。随着社区持续优化，模型有望成为 Web Agent 领域的常用配置。感兴趣的读者不妨前往 Hugging Face 下载试用。

地址：https://huggingface.co/browser-use/bu-30b-a3b-preview