Inworld 推出 TTS-1.5:实时发声、超低延迟,支持多语言

近期,人工智能公司 Inworld 宣布上线其最新文本转语音模型 TTS-1.5。该模型以自然、富有情感的实时语音而备受关注,并能在低时延下提供多语言能力。

官方称,TTS-1.5 的使用费用约为每分钟 0.005 美元,号称较市面同类产品便宜 25 倍,这样的定价无疑会吸引大量用户关注。

image.png

在技术层面,TTS-1.5 将实时延迟控制在 250 毫秒以内,这意味着用户在对话中几乎感觉不到滞后。除速度显著提升外,模型在表现力与稳定性方面也得到优化。这为多种应用场景,尤其是游戏和虚拟现实里的对话系统,带来了新的可能。

除了颇具竞争力的价格,用户对低延迟的期待也持续升高。许多人认为延迟一直是文本转语音领域的一大难题。如今,Inworld 的这一进展为更真实的对话体验铺平了道路。社交平台上的讨论热度很高,大家都希望尽快把这款新模型用到自己的项目中。

划重点:

📢 TTS-1.5 登场,具备自然流畅的语音合成与多语言支持。

💰 费用约每分钟 0.005 美元,称比同类产品便宜 25 倍。

⚡ 实时延迟低于 250 毫秒,带来更贴近真实的对话体验。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享