12月16日,阿里巴巴发布新一代 万相2.6系列模型,面向专业影视制作与图像创作进行了全面升级,被称为“功能最全的视频生成模型”。万相2.6已同步上线阿里云百炼与万相官网。
万相2.6系列最大的看点是成为国内首个提供“角色扮演”能力的视频模型,同时还支持音画同步、多镜头生成与声音驱动等功能。
核心升级与技术进展
本次迭代在画质、音效和指令理解上进一步增强,并把单次视频时长提升到国内最高的15秒。这一模型家族已覆盖文生图、图像编辑、文生视频、图生视频、语音生视频、动作生成、角色扮演以及通用视频编辑等十余种视觉创作能力。
1. 角色扮演能力(国内首创):
万相2.6可参考输入视频中的人物外观与音色,依据提示词生成单人、多人或人与物共同出演的片段。在模型设计上,通义万相融入多项创新方案,对参考视频进行多模态联合建模与学习,抽取角色情绪、姿态、视觉特征,以及音色、语速等声学信息,保证在情感、形体与声音上的一致性与迁移效果。
2. 专业级分镜控制:
新增的分镜控制可把简短提示词自动转成多分镜脚本,生成由多个镜头组成的连贯叙事视频。借助高层语义理解,万相2.6能构建完整故事线与叙事张力的多镜头段落,并在顺滑切镜的过程中持续保持核心主体、场景布局和环境氛围的一致性。

面向影视级创作场景
万相2.6的角色扮演与分镜控制,能够更好地适配专业的影视级制作需求。
比如,用户上传一段个人视频,并给出科幻悬疑风格的提示词,万相2.6几分钟内即可完成分镜设计、角色演绎与画面配音,生成一支叙事完整、具有电影级运镜的短片,帮助用户实现“当一次电影主角”的愿望。
针对广告创意、短剧制作等专业用途,只需输入连续提示词,模型即可产出一段完整叙事的短片,让人人都有机会做导演。
延续国内领先
今年9月,阿里已在国内率先推出音画同步的视频生成模型万相2.5;在权威评测集 LMArena 上,万相图生视频成绩位居国内第一。此次2.6发布进一步稳固其在国内视频生成领域的领先位置。
即日起,所有用户可直接在万相官网体验万相2.6;企业用户可通过阿里云百炼调用 API。据悉,千问 APP 也将于近期接入该模型,带来更多玩法。



















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?