阿里发布万相2.6:上新“角色扮演”和多分镜控制,单段视频最长15秒

12月16日,阿里巴巴发布全新 万相2.6系列模型,面向影视级制作与图像创作场景做了全面升级,被外界称为**“功能覆盖最广的视频生成模型”。万相2.6已同步上线阿里云百炼万相官网**。

万相2.6系列最大的亮点是其作为国内首个支持“角色扮演”能力的视频模型;同时提供音画同频、多镜头生成与声音驱动等特性。

 核心升级与技术突破

本次迭代在画质、音效与指令跟随等方面进一步加强,并将单次视频时长提升至国内最高的15秒。该系列现已涵盖文生图、图像编辑、文生视频、图生视频、语音驱动生视频、动作生成、角色扮演及通用视频编辑等十余种视觉创作能力。

1. 角色扮演功能(国内首创):

万相2.6可参考输入视频中的角色外观与音色,按提示生成单人、多人,或人与物同框的视频。模型结构集成多项创新:对参考视频进行多模态联合建模学习,抽取主体情绪、姿态、视觉特征,以及音色与语速等声学特征,从而在多维度实现一致性保持与迁移。

2. 专业级分镜控制:

新增分镜控制,可把简短提示转为多分镜脚本,生成包含多个镜头的连贯叙事视频。凭借高层语义理解,万相2.6能构建具备完整故事线与叙事张力的多镜头段落,并在镜头顺滑切换中保持核心主体、场景布局与环境氛围的一致性。

QQ20251216-141210.png

赋能影视级创作场景

万相2.6的角色扮演与分镜控制,显著贴合专业影视级创作需求。

例如,用户上传一段个人视频,并输入科幻悬疑风格的提示,万相2.6几分钟内即可完成分镜设计、角色演绎与画面配音,输出一段叙事完整、电影感运镜的短片,帮助用户“圆电影主角梦”。

面向广告设计、短剧制作等专业场景,通过连续提示词,模型可生成一段完整叙事的短片,让人人都能当导演。

 延续国内领先地位

阿里在今年9月率先于国内发布音画同步视频生成模型万相2.5;在权威评测集 LMArena 上,万相图生视频位列国内第一。此次2.6上线,进一步夯实其在国内视频生成领域的领先位置。

即日起,所有人可前往万相官网体验万相2.6;企业用户可通过阿里云百炼调用 API。据悉,千问 APP 也将于近期接入该模型,带来更多玩法。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享