Soul 开放14亿参数实时数字人模型 SoulXFlashTalk,延迟低至亚秒级

近日,Soul AI Lab 宣布开源行业首个拥有14亿参数的实时数字人生成模型——SoulXFlashTalk。该模型亮点在于可实现亚秒级响应,并支持每秒32帧的高帧率,为实时交互场景提供完整的一体化解决方案。

SoulXFlashTalk 的开源意味着开发者可便捷获取项目页面、技术报告、源代码与模型权重,形成一个全面开放的体系。这一举措不仅大幅降低了研发门槛,也为更多创新项目奠定基础。值得一提的是,早在去年10月,Soul 已开源语音合成模型 SoulXPodcast,本次开放进一步完善了其“语音 + 视觉”的双模态开源矩阵。

image.png

Soul 的开源策略不仅仅是分享技术,更希望以开放协同的方式推动 AI 生态共同成长。公司表示,未来将继续坚持开源路线,持续释放更多 AI 技术成果,促进 AI 与社交领域的融合创新。

随着 Soul 在多模态 AI 生态布局的不断完善,业内人士普遍认为,这将为社交网络、在线教育、虚拟现实等领域带来颠覆性变化。可以预见,Soul 的探索将为未来数字交互体验树立新标杆,值得期待。

划重点:

🌟 Soul AI Lab 发布14亿参数的实时数字人模型 SoulXFlashTalk,响应迅速、帧率高。  

🚀 开源同步提供项目页面、技术报告、源代码与模型权重,降低研发门槛,激发更多创新。  

🤝 Soul 将持续推进开源战略,推动 AI 与社交创新融合,完善多模态 AI 生态。  

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享