快手系的 可灵 AI 今天正式上线「主体库」(Subject Library),为 O1 多模态视频模型加入“长期记忆”能力。只需上传一张角色图,系统就能补全 3D 视角、生成多种光照版本,并支持在不同场景通过「@角色名」一键调用。官方称「主体一致性>96%」,从此告别 AI 变脸。

从一张图到3D 记忆——主体库三步走
1. 上传:支持 JPG/PNG/RAW,自动抠图、校准、色彩统一
2. 补全:AI 衍生侧脸、背面与局部细节,提供 3 组方案可选
3. 调用:在提示词里输入「@角色名」,即可在任意镜头、光照、风格下保持同一张脸与服饰细节

AI 智能描述——让模型更懂你的想法
– 系统会自动抓取「发色+服饰+风格」,生成 60 字内关键词,用户可再次编辑
– 实验表明,启用智能描述后,复杂场景一次出片成功率提升 27%,平均可少调 12 分钟参数

O1 模型一体化入口——文图视频无缝接力
主体库与 O1 的「文本生视频」「图像生视频」「首尾帧控制」共享同一套底层 latent 空间,可实现:
– 同一角色可在多段视频连续出现,ID 漂移<0.03
– 支持 48fps/1080p 输出,单条时长最长 5 分钟
– 官方数据:自 2024 年上线起,Kling AI 已迭代 30+ 次,累计生成 2 亿条视频
行业影响——短视频迈入“一致性”时代
– 影视预览:制片方可用主体库锁定主角造型,快速做故事板,降低外景补拍成本
– 跨境电商:商家一次上传模特图,就能批量产出多语种试穿视频,制作成本降至 1/10
– 虚拟偶像:IP 方将 V 形象存入库,粉丝用「@角色」即可创作二创视频,不再担心“换脸”
开放计划与价格
– 免费版:最多存 5 个主体,每月 50 次调用
– Pro 版:29 元/月,主体数不限,含 600 次调用 + 5 分钟高清生成
– Enterprise API:按调用量计费,0.005 元/次,支持私有化部署与品牌定制
下一步:多人协同与实时风格化
可灵 AI 表示,2025 Q1 将上线「多人主体库」与「实时风格化」——同一画面可锁定 3 位角色,并可实时切换卡通、复古、赛博等全局风格,进一步渗透至长剧、广告、游戏动画管线。
编辑观点
当大家仍在卷“单条视频 4K60fps”参数时,可灵把重心转向“跨镜头一致性”,相当于给创作者装上一枚「数字记忆芯片」。一旦主体库成为行业标配,AI 视频将从“好玩”走向“好用”,短视频、广告乃至长剧的工业化流程都有望被重写。后续将持续关注其多人协同功能的开放进度与 Enterprise 版定价。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?