阿里发布万相2.6：上新“角色扮演”和多分镜控制，单段视频最长15秒-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

阿里发布万相2.6：上新“角色扮演”和多分镜控制，单段视频最长15秒

拥抱AI，AIGC最佳实践者

7111

12月16日，阿里巴巴发布全新 万相2.6系列模型，面向影视级制作与图像创作场景做了全面升级，被外界称为**“功能覆盖最广的视频生成模型”。万相2.6已同步上线阿里云百炼和万相官网**。

万相2.6系列最大的亮点是其作为国内首个支持“角色扮演”能力的视频模型；同时提供音画同频、多镜头生成与声音驱动等特性。

核心升级与技术突破

本次迭代在画质、音效与指令跟随等方面进一步加强，并将单次视频时长提升至国内最高的15秒。该系列现已涵盖文生图、图像编辑、文生视频、图生视频、语音驱动生视频、动作生成、角色扮演及通用视频编辑等十余种视觉创作能力。

1. 角色扮演功能（国内首创）:

万相2.6可参考输入视频中的角色外观与音色，按提示生成单人、多人，或人与物同框的视频。模型结构集成多项创新：对参考视频进行多模态联合建模学习，抽取主体情绪、姿态、视觉特征，以及音色与语速等声学特征，从而在多维度实现一致性保持与迁移。

2. 专业级分镜控制:

新增分镜控制，可把简短提示转为多分镜脚本，生成包含多个镜头的连贯叙事视频。凭借高层语义理解，万相2.6能构建具备完整故事线与叙事张力的多镜头段落，并在镜头顺滑切换中保持核心主体、场景布局与环境氛围的一致性。

赋能影视级创作场景

万相2.6的角色扮演与分镜控制，显著贴合专业影视级创作需求。

例如，用户上传一段个人视频，并输入科幻悬疑风格的提示，万相2.6几分钟内即可完成分镜设计、角色演绎与画面配音，输出一段叙事完整、电影感运镜的短片，帮助用户“圆电影主角梦”。

面向广告设计、短剧制作等专业场景，通过连续提示词，模型可生成一段完整叙事的短片，让人人都能当导演。

延续国内领先地位

阿里在今年9月率先于国内发布音画同步视频生成模型万相2.5；在权威评测集 LMArena 上，万相图生视频位列国内第一。此次2.6上线，进一步夯实其在国内视频生成领域的领先位置。

即日起，所有人可前往万相官网体验万相2.6；企业用户可通过阿里云百炼调用 API。据悉，千问 APP 也将于近期接入该模型，带来更多玩法。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐