生成式人工智能正加快从“只会聊天”的问答工具,升级为能够真正动手做事的“超级数字员工”。6月8日,云知声(9678.HK)正式推出新一代通用大语言模型——U2。这是一款面向个人用户、开发者以及企业组织打造的原生智能体(Agent)大模型。与以往高度依赖单轮对话的传统大模型不同,U2把技术重点明确放在“高智能密度”和“高Token价值”的实际交付能力上。
在真实业务场景里,传统模型通常更擅长处理短流程的文本生成任务,但一旦遇到复杂的系统性工程,往往就显得力不从心。而U2则重点增强了面向真实任务的持续执行闭环能力。面对复杂办公、软件开发、深度研究以及多工具协同等高难度场景,它可以像人类专家那样,把一个宏观且抽象的任务自行拆分,并持续推进超过100步的复杂工作流,真正实现从“被动回答”到“主动干活”的转变。
随着新模型一同公布的,还有一系列国内外权威能力评测的最新成绩,U2在多个关键指标上已进入主流大模型的第一梯队。在非常考验专业知识储备和复杂逻辑推理能力的 GPQA Diamond 评测中,U2拿到了87.9分的出色成绩,一举超过 GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)以及 MiniMax M2.7等多款业内强劲模型,说明它在应对高难度专业问题时具备很强的稳定表现。
除了在逻辑推理方面表现突出,U2在日常办公与知识工作中的实际交付效果也同样亮眼。在聚焦真实办公和知识工作产出能力的 GDPval 评测中,该模型取得了72.5分的优秀成绩。与常见的记忆型评测不同,GDPval 更关注模型在企业生产环境中的实际操作与成果输出。测试结果显示,U2已经能够较为成熟地独立完成海量资料分析、专业报告撰写、复杂表格处理、图表动态生成以及高质量幻灯片制作等一系列典型且高价值的办公任务。随着原生智能体大模型进一步走向常态化应用,AI 赋能产业的发展也正在迈向更深层次阶段。
用户38505528 9个月前0
粘贴不了啊用户12648782 10个月前0
用法杂不对呢?yfarer 10个月前0
草稿id无法下载,是什么问题?