MiniMax 开源完整 Office Skills 套件,用自进化解决文档生成痛点

在 AI 办公领域,许多人都有过类似的尴尬:让 AI 产出报表,结果公式被变成了静态数字;让它改 PPT 模板,排版立刻失控。针对“能生成却不能直接用”的老大难问题,大模型厂商 MiniMax(稀宇科技)近日宣布正式开源其生产级办公文档引擎 Office Skills。这套基于 MIT 协议的项目,旨在让 AI 生成的 Word、Excel、PPT 和 PDF 真正达到“拿来就能交付”的水准。

image.png

底层重构:绕开“常规”库,追求高保真控制

MiniMax 在技术路线上的选择相当硬核。为避免常见 Python 库在复杂格式处理中“悄悄丢失”的情况,他们放弃了上手简单但能力受限的方案:

  • Excel(xlsx):不使用 openpyxl,改为直接在 XML 层动“手术”。通过解压、精确修改节点再重新打包,确保数据透视表、VBA 宏和复杂公式原封不动。

  • Word(docx):弃用轻量的 python-docx,转向由微软官方维护的 .NET OpenXML SDK,从而完整支持嵌套表格、页眉页脚及修订追踪。

  • PDF 与 PPT:采用“双引擎”拆分策略:比如 PDF 的封面用 HTML+CSS 渲染以保证设计感,正文交由 ReportLab 提供稳定性;PPT 则预置四套视觉“配方”,确保全局风格统一。

自循环进化:能自我纠错的“数字员工”

除了开源工具链,MiniMax 还公布了名为 Execute → Evaluate → Fix 的自进化机制。这意味着这些 Skill 并非静态代码,而是配有自动评测框架:当生成文档出现问题时,系统会自动捕捉结构、公式或版式上的错误,并沉淀为修复案例持续迭代。

在真实办公场景中,这让 Office Skills 越用越稳。无论是高端 Omakase 的日料菜单,还是投行标准的金融报表,AI 不再只给出“Demo”,而是交付逻辑闭环、格式合规的成品。随着这套能力的开源,办公 Agent 赛道有望告别“草台班子”,迈向专业化交付。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享