告别高价订阅!Resemble AI 开源旗舰级 TTS,上线内置水印,直指商业落地

AI 语音赛道再迎强势选手,初创公司 Resemble AI 正式推出开源文本转语音模型“Chatterbox Turbo”,直接对标 ElevenLabs 与 Cartesia 等行业头部。

这款模型在性能上大幅升级,仅需 5 秒参考音频即可精准复刻目标声音,并能在约 150 毫秒内输出首段音频。这样的极致低延迟,非常适合构建实时 AI 代理、自动化客服、动态游戏角色、虚拟形象与社交互动等应用。Resemble AI 称,模型的合成质量已超过多款闭源方案,可为开发者带来更加自然的语音体验。

在安全合规方面,Chatterbox Turbo 面向受监管行业内置名为“PerTh”的神经水印能力,可标识并校验语音为 AI 生成,有效应对深度伪造风险。更具突破性的是,Resemble AI 以 MIT 许可证开源该模型,全球开发者不仅能在 Hugging Face、RunPod、Modal、Replicate、Fal 等平台免费试用,还可在 GitHub 获取完整代码,用于商业化修改与分发。

目前,Resemble AI 已上线托管服务,并计划在不久的将来发布延迟进一步优化的版本,期望借助开源生态重塑语音合成市场的竞争格局。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享