最近,麻省理工学院背景的初创公司 OpenAGI 正式亮相,宣布其新推出的 AI 模型 Lux 在电脑操作任务上的表现超过 OpenAI 和 Anthropic 的同类产品,成本却只有它们的大约十分之一。OpenAGI 首席执行官秦增义表示,Lux 是一款基础模型,能通过解析电脑截图,自动在桌面应用里执行操作。
在最新发布的 Online-Mind2Web 基准测试中,Lux 的成功率达到 83.6%,OpenAI 的 Operator 为 61.3%,Anthropic 的 Claude Computer Use 为 56.3%。这一明显的差距让业界对 Lux 的技术能力更加期待。
不同于传统的大语言模型,Lux 采用“Agent 主动预训练”的方法,专注从电脑截图和动作序列学习。这个自我强化的训练循环让 Lux 能在不断探索中提升能力,操作更高效。
OpenAGI 还表示,Lux 的运行成本约是 OpenAI 与 Anthropic 前沿模型的十分之一,速度也更快。与只会处理浏览器任务的对手不同,Lux 能全面操控桌面软件,包括 Excel、Slack 等,应用场景更广。公司同时发布开发者软件开发工具包,支持第三方基于 Lux 开发应用。
在安全方面,OpenAGI 为 Lux 内置了安全机制。一旦模型收到可能违反安全政策的请求,会拒绝执行并提示用户。随着 AI 代理加速发展,这样的防护尤为重要。
秦增义博士技术背景扎实,曾参与多款广受欢迎的 AI 模型研发,展现出小团队也能实现技术创新。
划重点:
– 🚀 Lux 在电脑操作评测中拿到 83.6% 成功率,明显领先 OpenAI 与 Anthropic。
– 💡 采用“主动预训练”,从截图与动作序列学习,能自我提升能力。
– 🔒 内置安全策略,可识别并拒绝风险请求,保护用户数据安全。

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?