
不同于过去需要把 ASR(语音转文本)、LLM(大语言模型)、TTS(文本转语音)层层串联的管线式方案,
此外,这款模型在个性化方面也很亮眼。通过“语音+文本”双提示,用户既能设定 AI 的角色与背景,还能细致调控音色与语调。AIbase 获悉,
研究:https://research.nvidia.com/labs/adlr/personaplex/
划重点:
-
🎙️ 全双工交互:
可实时处理语音流,支持在 AI 说话时用户随时插话或重叠发言,响应迅速。PersonaPlex-7B-v1 -
🧠 单模型架构: 不再依赖繁琐的管线拼接,采用单一
结构,同步预测文本与语音标记,让对话更自然顺滑。Transformer -
🎭 深度个性化: 支持最多 200 token 的系统提示词与专用语音嵌入,可灵活定制 AI 的角色人格、领域知识与情感音色。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?