商汤科技在28日正式发布并开源日日新 SenseNova U1系列原生统一的理解与生成模型。该系列基于商汤今年3月自研的 NEO-unify 架构,在单一模型中打通多模态的理解、推理与生成,实现深度统一,标志着多模态AI从“拼接整合”迈向“原生统一”的重要一步。
SenseNova U1采用的 NEO-unify 架构摒弃了主流的堆叠式方案,去除了视觉编码器(VE)和变分自编码器(VAE),重建统一的表征空间。该设计让多模态处理渗透到每一层计算,使语言与视觉以同一套表征协同建模,在保持语义信息丰富的同时,也能维持像素级的视觉细节还原。依托此技术,模型在逻辑推理与空间智能方面表现突出,能更精准地理解物理世界的复杂布局与细微关系。
顺应具身智能的发展趋势,商汤科技计划将这套模型作为机器人的“具身大脑”,在一个模型闭环内完成从环境感知、逻辑推断到任务执行的全流程。本次开源不仅为行业提供了关键的底层技术引擎,也释放出信号:AI模型正加速走向更高一体化、泛化更强的通用架构。
用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?