月之暗面官宣开源 Kimi K2.6,多个指标对齐全球顶尖大模型

国产大模型迎来重要更新。4月21日,月之暗面(Moonshot AI)正式发布并开源其最新旗舰模型 Kimi K2.6。该模型在编程能力、长时任务处理以及多Agent(智能体)协作上有明显跃升,现已在官网、APP、API及 Kimi Code 编程助手同步上线。

在多项衡量综合实力的权威评测中,K2.6展现出强劲表现。无论是被称为“人类最后考试”的高难度基准 Humanity’s Last Exam,还是检验真实软件工程水平的 SWE-Bench Pro,它都跻身行业第一梯队。监测数据显示,K2.6已可与 GPT-5.4、Claude Opus4.6 等国际顶尖闭源模型正面对比。

image.png

作为该系列迄今最强的编程向模型,K2.6在长程编码任务上的续航表现突出。实测可连续工作约13小时,单次任务可编写或修改超4000行代码,能够承担复杂系统的开发与迭代。得益于视觉与代码能力的深度融合,它还能独立产出具专业设计感的 Web 应用。内部评测显示,其代码能力较上一代提升约20%。

image.png

值得一提的是,K2.6展现出极佳的本地化泛化能力。通过以 Zig 语言优化推理流程,Kimi K2.6 已支持在 Mac 设备本地部署。在长达12小时的连续运行测试中,其吞吐量由初始的 15 tokens/s 提升至 193 tokens/s,整体推理效率较主流工具 LM Studio 高约20%,显著降低了开发者使用高标准模型的门槛。

在协同办公场景中,Kimi K2.6引入更强的 Agent 集群架构。系统最多可调度约300个子 Agent 并行协作,可处理约4000个协作步骤。用户只需给出一个复杂指令,模型便能自动分配不同专长的智能体,一次完成从深度搜索、文档分析到网页、PPT与表格的生成等全流程交付,大幅提升端到端任务的执行质量与效率。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享