1美元搞定200项浏览器操作！开源浏览器操控利器BU-30B-A3B-Preview正式上线-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，知名开源浏览器自动化项目BrowserUse发布了首个自研大语言模型——BU-30B-A3B-Preview。一经上线便引发热议，被视为“网页代理（Web Agent）领域的新标杆”，凭借超强的性价比与实时响应速度，大幅降低了AI操控浏览器的门槛。

模型架构：MoE方案，做到“大脑更强、体型更轻”

BU-30B-A3B-Preview采用混合专家（MoE）架构，总参数30B（300亿），推理时仅激活3B（30亿）参数。在保持一流智能的同时显著节省资源，单张消费级GPU即可顺畅运行。

该模型基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct深度微调，专为浏览器自动化场景优化，支持视觉+文本多模态输入，最长上下文可达32K tokens，轻松应对复杂、超长网页内容。

核心能力：出色的DOM理解与图像推理

在浏览器操作任务中，BU-30B-A3B-Preview表现优异，具备完整的网页交互能力：精准定位元素、点击、滚动、表单填写等。其强大的DOM（文档对象模型）理解与视觉推理能力，让AI代理能像人类一样“看懂”页面结构与截图，实现稳定可靠的自动化执行。

官方指出，该模型非常适合构建Web Agent应用，如自动化测试、数据采集、RPA流程等，并在内部基准评测中达到业内领先水平。

性能亮点：速度快、成本低双重领先

官方对比数据显示，BU-30B-A3B-Preview在任务速度与经济性方面明显优于主流商用模型：

– 平均每一步操作约1.2秒，整体任务完成更快。
– 成本优势显著：1美元计算资源可稳定完成约200个浏览器任务，较部分竞品提升数十倍。

由于模型体量适中（单GPU即可部署），开发者可在本地轻松下载测试，无需昂贵的云端开销。

开源意义：推动Web Agent生态加速

BU-30B-A3B-Preview已全面开源，模型权重已上传至Hugging Face平台，开发者可免费获取并与BrowserUse开源库无缝集成。这意味着浏览器自动化进入“高效开源时代”，将助力更多创新应用落地。

AIbase点评：BU-30B-A3B-Preview有力解决了传统大模型在浏览器任务中“贵且慢”的痛点。对需要大规模网页自动化的企业与开发者而言，这是一款性价比超高的选择。未来，随着社区持续优化，它有望成为Web Agent领域的标配。感兴趣的读者可前往Hugging Face立即下载体验。

地址：https://huggingface.co/browser-use/bu-30b-a3b-preview

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

1美元搞定200项浏览器操作！开源浏览器操控利器BU-30B-A3B-Preview正式上线