近期,Qwen3-TTS 语音合成模型迎来一次大更新,凭借亮眼表现,成为语音合成领域的新秀。本次版本不仅覆盖多音色、多语种与多方言,还显著提升生成的自然性和稳定性,用户可通过 Qwen API 直接调用这些能力。

音色库大幅扩容,现已提供超过49种高质量音色,涵盖不同性别、年龄与地域特色,方便在不同场景中挑选合适声音。比如,活泼可爱的茉兔、充满陪伴感的小野杏、以及气场十足的墨讲师等角色任你选择。丰富的音色让合成语音更具表现力,更能传达情感。
在多语种与方言方面,Qwen3-TTS 同样进步明显。它支持中文、英文、德语、法语等在内的10种主要语言,并在多语言测试中的平均词错误率(WER)优于不少同类产品。同时,它也支持多种方言音色,如普通话、粤语、闽南语等,能够真实还原地方口音与韵味,满足更广泛的使用需求。
在自然度上,模型的自适应调节能力进一步增强,可根据文本灵活调整语速与韵律,拟人化程度更接近真人,让听感更自然流畅。
在使用上,Qwen3-TTS 提供简单易上手的 API 接口,几行代码即可生成高质量语音内容。这样的设计降低了接入门槛,让更多人能便捷体验先进的语音合成技术。
Qwen3-TTS API文档:
https://help.aliyun.com/zh/model-studio/multi-round-conversation?spm=a2c4g.11186623.help-menu-2400256.d_0_1_1.49445002U6gJoz
划重点:
🌟 Qwen3-TTS 音色扩展至49+种,高品质与角色多样兼具,满足不同需求。
🌍 支持10种主要语言与多种方言,真实呈现地方口音特色。
🎤 自然度全面提升,拟人化更接近真人,听感更佳。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?