腾讯云推出音视频AI品牌WAND:集成六大自研模型和60余项AI能力

6月5日,在2026AI产业应用大会期间,腾讯云音视频正式发布AI原生能力底座WAND。依托二十多年的技术积累,腾讯云音视频这次围绕底层模型、媒体能力和接入方式做了全面升级,让音视频媒体AI能力以Agent-Native模式对行业开放,完成了从单一媒体处理能力提供方,向面向AI应用与Agent的原生媒体底座的战略升级

image.png

WAND整体采用模型引擎、能力层和场景方案三层架构,覆盖编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型,补上了主流生成式大模型在媒体生产流程中的一些短板。在能力层,腾讯云音视频又把60多项媒体AI能力按照生成、理解、处理、编码重新整理,并通过API、Agent预编排工作流(Agentic Workflow)和Skills三种方式开放,支持Agent端到端自动跑完整条链路,不需要频繁切换工具

image.png

WAND能力架构示意图

在实际业务场景中,WAND展现出很强的适配能力和处理效率。在电商场景里,WAND生成模型可以针对不同商品品类制定对应处理策略,能够有效降低报错率,提升图片可用率。在短漫剧创作方面,WAND把剧本生成、角色一致性保持等环节串成自动化链路,让平均生产效率提升90%,目前已服务国内80%以上的头部漫剧平台,其AI增强和无痕擦除技术还双双获得NAB Show2026年度产品奖

另外,面对高并发和超低延迟要求极高的赛事直播场景,WAND通过自研模型协同调度,把识别、生成、合成、编码打通成全自动流程。和传统方案相比,这套方案可节省超过50%的码率,累计已支撑数千场全球顶级赛事

作为连续11次保持中国及出海市场份额第一的领跑者,腾讯云音视频这次发布WAND,也在进一步推动音视频能力成为可被Agent统一调度的生产级工具,全面助力AI Agent时代的视听应用创新

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享