AI 语音赛道再添硬核选手。初创公司 Resemble AI 发布开源文本转语音模型“Chatterbox Turbo”,正面挑战 ElevenLabs、Cartesia 等头部品牌。
这款模型在性能上大幅提升,只需 5 秒参考音频就能精准复刻目标声音,并能在约 150 毫秒内生成首段音频。这种极致的低延迟表现,非常适合搭建实时 AI 代理、自动化客服、游戏中的动态角色、虚拟形象以及社交平台互动。Resemble AI 表示,其语音质量已超过多款闭源产品,为开发者提供更自然的合成体验。
在安全合规方面,Chatterbox Turbo 面向受监管行业内置“PerTh”神经水印,可用于标记并验证语音是否为 AI 生成,从源头降低深度伪造风险。更具突破的是,Resemble AI 以 MIT 许可证开源该模型,开发者不仅能在 Hugging Face、RunPod、Modal、Replicate 和 Fal 等平台免费体验,还可在 GitHub 获取完整代码进行商业化改造与分发。
目前,Resemble AI 已同步上线托管服务,并计划近期推出进一步降低时延的版本,试图以开源生态重塑语音合成市场的竞争格局。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?