腾讯云推出音视频AI品牌WAND：集成六大自研模型和60余项AI能力-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

6月5日，在2026AI产业应用大会期间，腾讯云音视频正式发布AI原生能力底座WAND。依托二十多年的技术积累，腾讯云音视频这次围绕底层模型、媒体能力和接入方式做了全面升级，让音视频媒体AI能力以Agent-Native模式对行业开放，完成了从单一媒体处理能力提供方，向面向AI应用与Agent的原生媒体底座的战略升级。

WAND整体采用模型引擎、能力层和场景方案三层架构，覆盖编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型，补上了主流生成式大模型在媒体生产流程中的一些短板。在能力层，腾讯云音视频又把60多项媒体AI能力按照生成、理解、处理、编码重新整理，并通过API、Agent预编排工作流（Agentic Workflow）和Skills三种方式开放，支持Agent端到端自动跑完整条链路，不需要频繁切换工具。

WAND能力架构示意图

在实际业务场景中，WAND展现出很强的适配能力和处理效率。在电商场景里，WAND生成模型可以针对不同商品品类制定对应处理策略，能够有效降低报错率，提升图片可用率。在短漫剧创作方面，WAND把剧本生成、角色一致性保持等环节串成自动化链路，让平均生产效率提升90%，目前已服务国内80%以上的头部漫剧平台，其AI增强和无痕擦除技术还双双获得NAB Show2026年度产品奖。

另外，面对高并发和超低延迟要求极高的赛事直播场景，WAND通过自研模型协同调度，把识别、生成、合成、编码打通成全自动流程。和传统方案相比，这套方案可节省超过50%的码率，累计已支撑数千场全球顶级赛事。

作为连续11次保持中国及出海市场份额第一的领跑者，腾讯云音视频这次发布WAND，也在进一步推动音视频能力成为可被Agent统一调度的生产级工具，全面助力AI Agent时代的视听应用创新。