多模态AI领军者ElevenLabs正式发布全新「Image & Video 平台」!这套方案不再只是做语音,而是把图像生成、视频创作、语音合成、音乐制作、音效设计统统集成在一起的超级AI内容工厂。由此,创作者与营销团队告别多工具来回切换,一键就能把剧本做成可直接投放的商业级视频。

一站式闭环:从零到成片,只需这一个平台
新平台将视觉生成与ElevenLabs拿手的音频能力彻底打通:先生成画面与动态视频,再在同一界面无缝叠加专业旁白、背景音乐、环境音效,整套流程紧密衔接。官方表示,从创意到能直接投放的营销短片,最快几分钟即可完成,大幅提升AI内容生产效率。
模型天团登场:顶级视觉+顶级听觉同屏合奏
Image & Video 平台一次集成全球最强多模态模型阵列,包括:
Google Veo(超长一致性视频)
OpenAI Sora(电影级画面质感)
Kling(超现实物理动效)
Nanobanana、Flux Kontext、Seedream 等新锐黑马
配合ElevenLabs自研的自然拟真AI语音与最新音乐生成模型,用户可自由混搭“最强视觉”与“最强听觉”,整体效果远胜单一模型拼接。
为商业而来:营销人沉默,短视频博主狂喜
平台针对创作者与营销场景深度优化:
支持竖屏/横屏多比例输出,适配抖音、小红书、TikTok、YouTube
内置可商用且安全的语音与音乐库,生成内容可直接用于广告投放
一键替换旁白语言,快速生成多语种版本
内含完整时间线编辑器,音画同步可精确到帧
实测效果拉满:30秒品牌广告,5分钟成片
按官方演示,仅凭一段30秒文案,即可在平台内完成:
1. 生成品牌分镜图像 → 2. 转为流畅视频 → 3. 添加自然、专业级旁白 → 4. 叠加情绪化背景音乐与环境音效 → 5. 导出4K商用成片,全程无需Premiere、Midjourney、Runway、Suno来回导文件。
编辑部点评:
这次升级把“文本到视频”的天花板再次抬高,更关键的是把音画对齐这一难题一并搞定。当“看得见”的视觉生成与“听起来更真”的声音生成两大王者合体,独立创作者与中小企业将迎来降维式效率提升。这波更新,会让多少剪辑师与配音员压力倍增?
体验地址:https://elevenlabs.io/image-video


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?