阿里发布万相2.6：新增“角色扮演”和多分镜控制，单段视频最长15秒-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

阿里发布万相2.6：新增“角色扮演”和多分镜控制，单段视频最长15秒

拥抱AI，AIGC最佳实践者

5413

12月16日，阿里巴巴发布新一代 万相2.6系列模型，面向专业影视制作与图像创作进行了全面升级，被称为“功能最全的视频生成模型”。万相2.6已同步上线阿里云百炼与万相官网。

万相2.6系列最大的看点是成为国内首个提供“角色扮演”能力的视频模型，同时还支持音画同步、多镜头生成与声音驱动等功能。

核心升级与技术进展

本次迭代在画质、音效和指令理解上进一步增强，并把单次视频时长提升到国内最高的15秒。这一模型家族已覆盖文生图、图像编辑、文生视频、图生视频、语音生视频、动作生成、角色扮演以及通用视频编辑等十余种视觉创作能力。

1. 角色扮演能力（国内首创）:

万相2.6可参考输入视频中的人物外观与音色，依据提示词生成单人、多人或人与物共同出演的片段。在模型设计上，通义万相融入多项创新方案，对参考视频进行多模态联合建模与学习，抽取角色情绪、姿态、视觉特征，以及音色、语速等声学信息，保证在情感、形体与声音上的一致性与迁移效果。

2. 专业级分镜控制:

新增的分镜控制可把简短提示词自动转成多分镜脚本，生成由多个镜头组成的连贯叙事视频。借助高层语义理解，万相2.6能构建完整故事线与叙事张力的多镜头段落，并在顺滑切镜的过程中持续保持核心主体、场景布局和环境氛围的一致性。

面向影视级创作场景

万相2.6的角色扮演与分镜控制，能够更好地适配专业的影视级制作需求。

比如，用户上传一段个人视频，并给出科幻悬疑风格的提示词，万相2.6几分钟内即可完成分镜设计、角色演绎与画面配音，生成一支叙事完整、具有电影级运镜的短片，帮助用户实现“当一次电影主角”的愿望。

针对广告创意、短剧制作等专业用途，只需输入连续提示词，模型即可产出一段完整叙事的短片，让人人都有机会做导演。

延续国内领先

今年9月，阿里已在国内率先推出音画同步的视频生成模型万相2.5；在权威评测集 LMArena 上，万相图生视频成绩位居国内第一。此次2.6发布进一步稳固其在国内视频生成领域的领先位置。

即日起，所有用户可直接在万相官网体验万相2.6；企业用户可通过阿里云百炼调用 API。据悉，千问 APP 也将于近期接入该模型，带来更多玩法。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐