视频生成又慢又贵,一直是 AIGC 领域的老难题。如今,腾讯混元团队拿出了一种新的解法。
腾讯混元正式开源了全新的视频生成加速方案 DisCa,代码和模型权重均已对外提供。这项工作已被计算机视觉顶会 CVPR2026 收录,也是学界和业界首次在蒸馏后、少步模型上探索可学习特征缓存加速的尝试。

DisCa 的核心思路,是在已经完成蒸馏、推理步数很少的模型上,进一步压缩推理成本。传统特征缓存方法在多步生成模型上效果不错,但直接应用于少步蒸馏模型会带来较大的缓存误差,导致生成质量下降。DisCa 的破解之道是加入一个轻量级神经网络预测器,并通过对抗式训练,让预测器学会依据缓存特征更精准地预估后续特征的变化轨迹,从而在确保生成质量的前提下,将加速上限推进到 11.8 倍。

另一个值得关注的方向是 R-MeanFlow。MIT 何恺明团队提出的 MeanFlow 在图像生成上表现亮眼,但腾讯混元团队发现,直接用于更复杂的视频生成任务时,“一步生成”的目标过于激进,反而会给训练带来负面影响。他们给出的改法很直观:既然暂时不做一步生成,就把训练中过于激进的情形剪掉,把步长限制在合理区间。这个结论与 MIT 和谷歌团队的同期研究相互印证,相关做法已用于当前最佳开源视频生成模型 HunyuanVideo-1.5 的实际训练。
把这两个方向合起来看,DisCa 的价值不仅是一篇论文,更是在工程落地层面给出了一条可复现的路径。对需要大规模部署视频生成能力的团队而言,这套开源方案很值得深入研究。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?