谷歌 Gemini 上线新能力:多图参考引导 AI 生成视频与音频

近日,谷歌为 Gemini 应用带来更新,推出更灵活的 AI 视频生成控制方式。现在,用户可以在一次视频提示中上传多张参考图像。系统会结合这些图片和文字生成视频与音频,让用户更容易掌控成片的画面和声音效果。

image.png

谷歌此前已在其扩展型视频 AI 平台 Flow 中试用这项功能。Flow 不仅能延长已有视频片段、拼接多段场景,还提供比 Gemini 应用更高的视频配额。按照谷歌的说法,10月中旬推出的 Veo3.1 相比 Veo3.0,在纹理逼真度、输入还原度以及音频品质方面都有明显进步。

这次更新让用户能更自由地使用 AI 工具,制作更贴合自己需求的内容。多参考图像的上传能力,意味着创作者可以在视频中加入更多个人化元素,为观众呈现更丰富的视觉与听觉体验。

在当下 AI 技术快速发展的背景下,谷歌此举展现了其在视频生成方向上的持续创新。随着用户需求更趋多样,工具的灵活性与可定制性愈发重要,Gemini 的新功能有望吸引更多创作者尝试与使用。

划重点:

🌟 支持在一个提示中上传多张参考图,帮助 AI 生成更符合预期的视频与音频。  

🎥 新能力让用户对最终成片的画面与声音有更强的掌控。  

🔊 Veo3.1 在视频质感与音频体验上较 Veo3.0 有明显提升。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享