12月16日,阿里巴巴发布全新 万相2.6系列模型,面向影视级制作与图像创作场景做了全面升级,被外界称为**“功能覆盖最广的视频生成模型”。万相2.6已同步上线阿里云百炼和万相官网**。
万相2.6系列最大的亮点是其作为国内首个支持“角色扮演”能力的视频模型;同时提供音画同频、多镜头生成与声音驱动等特性。
核心升级与技术突破
本次迭代在画质、音效与指令跟随等方面进一步加强,并将单次视频时长提升至国内最高的15秒。该系列现已涵盖文生图、图像编辑、文生视频、图生视频、语音驱动生视频、动作生成、角色扮演及通用视频编辑等十余种视觉创作能力。
1. 角色扮演功能(国内首创):
万相2.6可参考输入视频中的角色外观与音色,按提示生成单人、多人,或人与物同框的视频。模型结构集成多项创新:对参考视频进行多模态联合建模学习,抽取主体情绪、姿态、视觉特征,以及音色与语速等声学特征,从而在多维度实现一致性保持与迁移。
2. 专业级分镜控制:
新增分镜控制,可把简短提示转为多分镜脚本,生成包含多个镜头的连贯叙事视频。凭借高层语义理解,万相2.6能构建具备完整故事线与叙事张力的多镜头段落,并在镜头顺滑切换中保持核心主体、场景布局与环境氛围的一致性。

赋能影视级创作场景
万相2.6的角色扮演与分镜控制,显著贴合专业影视级创作需求。
例如,用户上传一段个人视频,并输入科幻悬疑风格的提示,万相2.6几分钟内即可完成分镜设计、角色演绎与画面配音,输出一段叙事完整、电影感运镜的短片,帮助用户“圆电影主角梦”。
面向广告设计、短剧制作等专业场景,通过连续提示词,模型可生成一段完整叙事的短片,让人人都能当导演。
延续国内领先地位
阿里在今年9月率先于国内发布音画同步视频生成模型万相2.5;在权威评测集 LMArena 上,万相图生视频位列国内第一。此次2.6上线,进一步夯实其在国内视频生成领域的领先位置。
即日起,所有人可前往万相官网体验万相2.6;企业用户可通过阿里云百炼调用 API。据悉,千问 APP 也将于近期接入该模型,带来更多玩法。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?