昆仑万维开源SkyReels-V3,多模态视频生成迎来新突破

1月29日,昆仑万维(Skywork AI)对外公布并开源其自主研发的“通用型”视频生成大模型——SkyReels-V3。 这一发布意味着视频生成迈入高保真与多模态的新阶段,基于统一建模框架,将参考图像转视频、视频延长和音频驱动虚拟形象三大能力深度融合。

在**参考图像转视频(I2V)**方面,SkyReels-V3可接收1至4张参考图作为输入,能够准确保留人物身份特征与画面构图。评测结果显示,其在参考一致性和画质等指标上表现优秀,优于 Vidu Q2 与 Kling1.6 等主流商用模型。

QQ20260129-154437.png

围绕视频创作中的时长与叙事难题,SkyReels-V3带来强大的视频延长能力。该功能不仅支持视角的自然延续,还加入“镜头切换延长模式”,内置切入、正反镜头等专业电影转场手法,让 AI 生成视频从单纯的“时间拉长”升级为更有逻辑的“叙事推进”。

此外,**音频驱动虚拟形象(Talking Avatar)**模块依托精准的音视频对齐,实现了极高的口型同步率,并支持分钟级长视频生成与多角色互动,为数字人直播和在线教育带来更自然的交流体验。

QQ20260129-154523.png

目前,SkyReels-V3 GitHub 现已开源,并提供限时免费 API 调用服务。昆仑万维表示,将持续推进“All in AGI 与 AIGC”战略,用开源驱动 AI 视频创作生态发展。

地址:GitHub:https://github.com/SkyworkAI/SkyReels-V3

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享