Inworld 发布 TTS-1.5:低延迟实时语音,支持多语言

近日,AI 公司 Inworld 推出最新文本转语音模型 TTS-1.5。它主打自然、富有情感的实时合成语音,在低延迟下也能支持多种语言。

官方称,TTS-1.5 的使用费用约为每分钟 0.005 美元,相比市场上同类产品便宜约 25 倍,这样的价格很有吸引力。

image.png

在技术表现上,TTS-1.5 可实现低于 250 毫秒的实时延迟,几乎让对话毫无等待感。除了更快,模型在表达力与稳定性方面也做了优化,为游戏和虚拟现实等对话系统带来新的可能。

除了价格优势,用户对低延迟的需求也与日俱增。许多人认为延迟是文本转语音的一大难题。如今,Inworld 的这一升级让更真实的对话体验更近一步。社交平台上不少用户对此表示关注,期待将这款模型应用到自己的项目中。

划重点:

📢 TTS-1.5 上线,语音自然,并支持多语言。

💰 使用费用约每分钟 0.005 美元,比同类产品便宜约 25 倍。

⚡ 实时延迟低至 250 毫秒以内,带来更顺畅的对话体验。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享