港大团队开源重器!一条命令把任何软件变成AI Agent“原生工具”,告别UI自动化崩溃噩梦

随着AI Agent的加速进化,让大模型直接驱动各类专业软件(如图像编辑、3D建模、办公套件等)成了开发者的共识难点。传统的UI自动化动不动就崩,手写脚本对接又费时费力。香港大学数据智能实验室(HKUDS)近日开源的CLI-Anything带来颠覆式解法:只需一条命令,就能把任意软件变成AI Agent可直接调用的结构化命令行工具,真正迈向“Agent-Native”的软件生态。

image.png

核心亮点:自动产出CLI,让软件能“听懂”AI指令

CLI-Anything基于全自动7步流水线(源码分析 → 架构设计 → 实现Click CLI → 测试规划 → 测试编写 → 文档生成 → 发布Python包),从软件源码或仓库出发,自动构建可用于生产的命令行接口。生成的CLI具备以下关键能力:

  • 结构化、可组合:命令格式贴合大模型输入,支持链式组合复杂工作流;
  • 原生JSON输出:所有命令均支持 –json 开关,方便AI解析,省去繁琐后处理;
  • 自描述能力:标准 –help 自动生成文档,Agent 可自助发现与理解功能;
  • 交互式REPL:统一的终端交互界面,支持历史记录与进度展示;
  • 高稳定性:覆盖 1588+ 项测试(含单元与端到端),全部通过。

不同于易碎的GUI自动化或RPA方案,CLI-Anything直连软件的真实后端(如Blender渲染引擎、LibreOffice文件处理),可生成标准项目文件(SVG、ODF、MLT XML等),功能完备、结果更可控。

已支持的软件持续扩容

项目现已为13款主流开源/专业软件完成CLI封装,包括:

  • GIMP(图像编辑)
  • Blender(3D建模)
  • Inkscape(矢量图形)
  • Audacity(音频制作)
  • LibreOffice(办公套件)
  • OBS Studio(直播录制)
  • Kdenlive / Shotcut(视频剪辑)
  • Zoom(视频会议)
  • Draw.io / Mermaid(图表绘制)
  • ComfyUI(AI图像生成)等。

团队表示,后续将扩展至更多领域,如CAD、DAW、IDE、科学计算工具等,也欢迎社区为自选软件贡献CLI封装。

安装与接入很简单,主流Agent框架一键打通

安装门槛极低,尤其面向Claude Code用户:

在插件市场直接添加:

/plugin marketplace add HKUDS/CLI-Anything

/plugin install cli-anything

随后执行:

/cli-anything <软件路径或仓库>

项目同时支持与OpenClaw(通过SKILL.md技能文件)、OpenCode、Codex、Qodercli等多种Agent框架无缝对接。全程本地运行,无需云端依赖或复杂配置。

社区热度爆表,GitHub星标已超1.7万

自开源以来,CLI-Anything迅速登上GitHub趋势榜,在短时间内收获数万星标。开发者普遍认为,这不只是一个工具,更是通往“Agent操控一切软件”未来的关键底座。许多人已把它融入日常工作流,尝试AI自动批量处理图像、渲染3D模型、剪辑视频等应用场景。

项目地址:https://github.com/HKUDS/CLI-Anything

编辑点评:CLI-Anything的出现,让“软件为人服务”进一步进化为“软件为Agent服务”。它避开了UI自动化的各种坑,用最可靠的CLI形态,重新盘活人类沉淀多年的软件资产。对AI Agent开发者、自动化爱好者与效率工具追求者而言,这个项目值得立刻star并深入研究。未来,谁先掌握“Agent-Native”接口,谁就握住了下一代生产力的钥匙。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享