具身智能与大模型的结合再迈一步。智元机器人近日宣布与MiniMax(上海稀宇科技)达成战略合作,MiniMax将为智元人形机器人提供端到端文本转语音(TTS)能力,明显提升机器人在真实场景中的自然对话与情感表达。
全链路语音加持,打造“会说话”的智能体
此次合作聚焦语音合成核心技术。MiniMax将在高自然度发声、多情感语调建模、低时延实时推理等方面的优势,深度融入智元机器人系统。这将让智元人形机器人可以:
– 以接近真人的顺畅语调进行交流;
– 依照上下文自动切换喜悦、关切、郑重等情绪语气;
– 在复杂噪声环境中实现低延迟、清晰度高的语音输出,保证人机沟通效率。
相关能力将率先落地于智元在家庭服务、商业导览、医疗陪护等应用场景的机器人产品中,让AI不只“看得见、做得对”,更能“说得准、讲得暖”。
强强联手:大模型公司×具身智能先锋
MiniMax作为国内大模型第一梯队代表,其MoE架构大模型与端侧推理优化已广泛应用在手机、汽车、IoT设备;智元机器人则在人形机器人本体控制、运动规划与场景落地上持续突破。此次携手,标志着“大脑”(大模型)正更快地融入机器人体系。
行业观点认为,语音交互是人形机器人走向实用化的关键环节。当机器人能用自然、有温度的声音与人沟通,用户的接受度与信任感会显著提升,为规模化商用铺路。
观察:语音不再是“附属功能”,而是具身智能的“灵魂接口”
在当前人形机器人竞赛中,多数厂商更关注行走、抓取等物理能力,而智元与MiniMax的合作,突出对交互体验的重视。未来,真正能走进家庭与公共场所的机器人,或许不是跑得最快的,而是最会“说话”、最懂人的。
随着大模型厂商从“云端”走向“端侧”,并与硬件伙伴共建“感知—决策—执行—表达”的全栈智能体,中国具身智能生态正加速成熟。而这场由语音点燃的温情变革,或将成为人形机器人破圈的关键。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?