AI 语音赛道再迎强势选手,初创公司 Resemble AI 正式推出开源文本转语音模型“Chatterbox Turbo”,直接对标 ElevenLabs 与 Cartesia 等行业头部。
这款模型在性能上大幅升级,仅需 5 秒参考音频即可精准复刻目标声音,并能在约 150 毫秒内输出首段音频。这样的极致低延迟,非常适合构建实时 AI 代理、自动化客服、动态游戏角色、虚拟形象与社交互动等应用。Resemble AI 称,模型的合成质量已超过多款闭源方案,可为开发者带来更加自然的语音体验。
在安全合规方面,Chatterbox Turbo 面向受监管行业内置名为“PerTh”的神经水印能力,可标识并校验语音为 AI 生成,有效应对深度伪造风险。更具突破性的是,Resemble AI 以 MIT 许可证开源该模型,全球开发者不仅能在 Hugging Face、RunPod、Modal、Replicate、Fal 等平台免费试用,还可在 GitHub 获取完整代码,用于商业化修改与分发。
目前,Resemble AI 已上线托管服务,并计划在不久的将来发布延迟进一步优化的版本,期望借助开源生态重塑语音合成市场的竞争格局。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?