从“听得懂”到“说得准”:中国高校推出UniCorn框架,修复AI图像生成的逻辑偏差

由中国科学技术大学联合多所国内高校组成的团队近日发布一套名为“UniCorn”的新型技术框架。该框架的主要目标,是让自动化图像处理系统具备“自我体检”的能力:在生成内容时主动发现并修补自身问题。

团队发现,当前的图像识别与生成模型虽然能看懂复杂画面,但把理解转成具体图像时,常出现认知与表达对不上的情况。比如,系统能准确识别样图里“左边是沙滩、右边是海浪”,可一到自主生成新图,位置却容易被反转。

AI 人工智能 机器人

研究者将这种“能理解却复述不准”的现象类比为医学中的“传导性失语症”。为弥合理解与表达之间的落差,UniCorn引入了一套协同工作的新机制。

UniCorn的核心思路是:既然多数系统“评判图像质量”的能力往往强于“从零生成”,那就让这把“评估标尺”反过来引导生成过程。为此,研究团队在同一运行空间内赋予模型三种互补角色,让它同时担任观察者、执行者和质检员。

在这样的分工下,系统一边出图一边对照自身的评价标准;一旦发现画面与既定逻辑不一致,内部纠错机制会立即介入并调整。初步测试表明,该架构在处理复杂空间关系与细节纹理方面的准确性有了显著提升。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享