在 AI 办公领域,许多人都有过类似的尴尬:让 AI 产出报表,结果公式被变成了静态数字;让它改 PPT 模板,排版立刻失控。针对“能生成却不能直接用”的老大难问题,大模型厂商 MiniMax(稀宇科技)近日宣布正式开源其生产级办公文档引擎 Office Skills。这套基于 MIT 协议的项目,旨在让 AI 生成的 Word、Excel、PPT 和 PDF 真正达到“拿来就能交付”的水准。

底层重构:绕开“常规”库,追求高保真控制
MiniMax 在技术路线上的选择相当硬核。为避免常见 Python 库在复杂格式处理中“悄悄丢失”的情况,他们放弃了上手简单但能力受限的方案:
-
Excel(xlsx):不使用 openpyxl,改为直接在 XML 层动“手术”。通过解压、精确修改节点再重新打包,确保数据透视表、VBA 宏和复杂公式原封不动。
-
Word(docx):弃用轻量的 python-docx,转向由微软官方维护的 .NET OpenXML SDK,从而完整支持嵌套表格、页眉页脚及修订追踪。
-
PDF 与 PPT:采用“双引擎”拆分策略:比如 PDF 的封面用 HTML+CSS 渲染以保证设计感,正文交由 ReportLab 提供稳定性;PPT 则预置四套视觉“配方”,确保全局风格统一。
自循环进化:能自我纠错的“数字员工”
除了开源工具链,MiniMax 还公布了名为 Execute → Evaluate → Fix 的自进化机制。这意味着这些 Skill 并非静态代码,而是配有自动评测框架:当生成文档出现问题时,系统会自动捕捉结构、公式或版式上的错误,并沉淀为修复案例持续迭代。
在真实办公场景中,这让 Office Skills 越用越稳。无论是高端 Omakase 的日料菜单,还是投行标准的金融报表,AI 不再只给出“Demo”,而是交付逻辑闭环、格式合规的成品。随着这套能力的开源,办公 Agent 赛道有望告别“草台班子”,迈向专业化交付。


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?