谷歌 Gemini 上线新能力：多图参考引导 AI 生成视频与音频-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌 Gemini 上线新能力：多图参考引导 AI 生成视频与音频

拥抱AI，AIGC最佳实践者

3112

近日，谷歌为 Gemini 应用带来更新，推出更灵活的 AI 视频生成控制方式。现在，用户可以在一次视频提示中上传多张参考图像。系统会结合这些图片和文字生成视频与音频，让用户更容易掌控成片的画面和声音效果。

谷歌此前已在其扩展型视频 AI 平台 Flow 中试用这项功能。Flow 不仅能延长已有视频片段、拼接多段场景，还提供比 Gemini 应用更高的视频配额。按照谷歌的说法，10月中旬推出的 Veo3.1 相比 Veo3.0，在纹理逼真度、输入还原度以及音频品质方面都有明显进步。

这次更新让用户能更自由地使用 AI 工具，制作更贴合自己需求的内容。多参考图像的上传能力，意味着创作者可以在视频中加入更多个人化元素，为观众呈现更丰富的视觉与听觉体验。

在当下 AI 技术快速发展的背景下，谷歌此举展现了其在视频生成方向上的持续创新。随着用户需求更趋多样，工具的灵活性与可定制性愈发重要，Gemini 的新功能有望吸引更多创作者尝试与使用。

划重点:

🌟 支持在一个提示中上传多张参考图，帮助 AI 生成更符合预期的视频与音频。

🎥 新能力让用户对最终成片的画面与声音有更强的掌控。

🔊 Veo3.1 在视频质感与音频体验上较 Veo3.0 有明显提升。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐