近期,人工智能公司 Inworld 宣布上线其最新文本转语音模型 TTS-1.5。该模型以自然、富有情感的实时语音而备受关注,并能在低时延下提供多语言能力。
官方称,TTS-1.5 的使用费用约为每分钟 0.005 美元,号称较市面同类产品便宜 25 倍,这样的定价无疑会吸引大量用户关注。

在技术层面,TTS-1.5 将实时延迟控制在 250 毫秒以内,这意味着用户在对话中几乎感觉不到滞后。除速度显著提升外,模型在表现力与稳定性方面也得到优化。这为多种应用场景,尤其是游戏和虚拟现实里的对话系统,带来了新的可能。
除了颇具竞争力的价格,用户对低延迟的期待也持续升高。许多人认为延迟一直是文本转语音领域的一大难题。如今,Inworld 的这一进展为更真实的对话体验铺平了道路。社交平台上的讨论热度很高,大家都希望尽快把这款新模型用到自己的项目中。
划重点:
📢 TTS-1.5 登场,具备自然流畅的语音合成与多语言支持。
💰 费用约每分钟 0.005 美元,称比同类产品便宜 25 倍。
⚡ 实时延迟低于 250 毫秒,带来更贴近真实的对话体验。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?