快手最近把其视频生成器 Kling 升级到 2.6 版,带来语音控制与动作控制两项核心能力,为 AI 视频生成领域再添突破。这次更新不仅支持原生音频生成,还显著提升了复杂动作的处理准确度。

语音控制:从配音到个性化声音定制
Kling 2.6 的语音控制建立在视频与音频同步生成技术之上,类似 Google Veo3 和 Sora2,可让画面、音效、人声与音乐自然匹配。它支持说话、对话、旁白、歌唱、说唱等多种声线类型,同时能处理环境噪声与复合场景音效。
更亮眼的是,用户现在可以上传自定义声音进行训练,或直接上传音频文件用于文生视频创作。这项能力大幅提升了角色一致性——生成视频中的角色能用清晰、易辨认的声音说话,从而在多个片段中保持统一。
Kling AI 展示的应用覆盖产品演示、生活方式视频博客、新闻播报、体育解说、纪录片、访谈节目、剧情短片、音乐表演,甚至包括复调合唱等复杂形态。
动作控制升级:复杂全身动作更精准
第二项重磅更新以动作控制系统的全面提升为重点。根据 Kling AI 介绍,系统现在能更细致地捕捉全身动作,即便是武术或舞蹈这类快速且复杂的动作也能准确处理。
官方特别指出,两个长期难点得到改善:手部动作更清晰不糊,面部表情与口型同步更自然。用户可上传 3 至 30 秒的动作参考片段生成连贯序列,并能通过文本提示微调场景细节。
社交媒体上已经出现了大量效果惊艳的应用案例,显示 AI 生成视频内容持续走热,创作者正在抓住新机遇,也涌现出许多充满创意的作品。

价格优势与市场布局
Kling 2.6 除了在自有平台提供服务外,还能通过 Fal.ai、Artlist 和 Media.io 等第三方平台使用。API 定价约为每秒生成视频 0.07 至 0.14 美元,价格会随生成速度、时长和分辨率变化,整体竞争力十足。Kling AI 本身采用积分制收费。
12 月初,快手还发布了 Video O1——号称“全球首款统一多模态视频模型”,可用文字指令编辑现有视频,实现更改主角、天气或视频风格等操作。
凭借这些创新功能,快手在竞争激烈的 AI 视频市场中与 Google、OpenAI、Runway 等西方公司,以及海罗、世达、维都等中国对手展开竞争。值得注意的是,快手运营着与 TikTok 规模相当的全球最大短视频平台之一快手(Kwai),这使其能够获取海量音视频与运动数据,为训练视频模型、实现声音同步与动作逼真提供独特优势。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?