近日,AI 公司 Inworld 推出最新文本转语音模型 TTS-1.5。它主打自然、富有情感的实时合成语音,在低延迟下也能支持多种语言。
官方称,TTS-1.5 的使用费用约为每分钟 0.005 美元,相比市场上同类产品便宜约 25 倍,这样的价格很有吸引力。

在技术表现上,TTS-1.5 可实现低于 250 毫秒的实时延迟,几乎让对话毫无等待感。除了更快,模型在表达力与稳定性方面也做了优化,为游戏和虚拟现实等对话系统带来新的可能。
除了价格优势,用户对低延迟的需求也与日俱增。许多人认为延迟是文本转语音的一大难题。如今,Inworld 的这一升级让更真实的对话体验更近一步。社交平台上不少用户对此表示关注,期待将这款模型应用到自己的项目中。
划重点:
📢 TTS-1.5 上线,语音自然,并支持多语言。
💰 使用费用约每分钟 0.005 美元,比同类产品便宜约 25 倍。
⚡ 实时延迟低至 250 毫秒以内,带来更顺畅的对话体验。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?