具身智能与大模型的融合再升级。智元机器人近日宣布与MiniMax(上海稀宇科技)达成战略合作,MiniMax将为智元人形机器人提供端到端文本转语音(TTS)能力,大幅提升机器人在真实场景中的自然交流与情感表达。
全链路语音加持,打造“能说会聊”的智能体
此次合作聚焦语音合成核心技术。MiniMax将在高自然度语音生成、多情感语调建模、低延迟实时推理等方面的优势,深度集成进智元机器人系统。这意味着智元人形机器人将能:
– 用接近真人的自然语调进行对话;
– 按上下文自动切换开心、关切、郑重等情绪语气;
– 在嘈杂环境中依旧实现低延迟、高清晰度的语音输出,保障人机沟通效率。
相关技术将率先应用于智元面向家庭服务、商业导览、医疗陪护等场景的产品中,让AI不仅“看得见、做得对”,更能“说得准、讲得暖”。
强强联手:大模型厂商 × 具身智能先行者
MiniMax作为国内大模型第一梯队代表,其MoE架构大模型与端侧推理优化能力,已广泛落地于手机、汽车和IoT设备;智元机器人则在人形机器人本体控制、运动规划与场景化应用方面持续突破。此次合作,意味着“大脑”(大模型)正加速与机器人融合。
行业观点认为,语音交互是人形机器人走向实用的关键一环。当机器人能用自然、有温度的声音与人沟通,用户的接受度与信任感将明显提升,为规模化商用铺平道路。
AIbase观察:语音不再是“附属功能”,而是具身智能的“灵魂接口”
在当下的人形机器人竞赛中,不少厂商更关注行走、抓取等物理能力,而智元与MiniMax的合作,突出了对交互体验的重视。未来,真正能走进家庭与公共场景的机器人,或许不是跑得最快的,而是最会“说话”、最懂人心的那个。
随着大模型厂商从“云端”走向“端侧”,与硬件厂商共建“感知—决策—执行—表达”全栈智能体,中国具身智能生态正加速成熟。而这场由语音引领的温暖变革,或将成为人形机器人破圈的关键。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?