4月29日,腾讯混元团队宣布开源其翻译模型的极限量化版本——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于,把覆盖33种语言的翻译能力精简到约440MB,也就是说,即使是存储空间紧张的移动设备,也能在完全离线的情况下实现高质量的实时翻译。

极致压缩:为手机内存来一场“减负”
该成果源自腾讯此前推出的专业翻译大模型Hy-mt1.5。原本的1.8B模型在常规精度下需要约3.3GB内存,这对手机本地运行而言负担不小。为解决这一痛点,团队采用极致量化压缩策略,将参数表示从16位(16-bit)降至最低1.25位。
通俗来说,就像在尽量保留关键细节的前提下,把一张4K高清图压成更小体积的缩略图。针对不同设备性能,腾讯同步提供2-bit与1.25-bit两种量化方案,确保“瘦身”后的模型依然具备出色的语义理解能力。
性能实测:离线状态下的翻译质量超越多款主流产品
尽管体积大幅缩小,但性能并未打折。官方评测显示,这款1.8B级的轻量模型在多项基准上,翻译质量已能对标甚至超越谷歌翻译等主流商业系统,部分维度上甚至可与参数量达千亿级(235B)的庞大模型一较高下。

目前,模型原生支持包括中文、英语、日语、法语、俄语、阿拉伯语在内的33种语言,并覆盖藏语、蒙古语等少数民族语种。同时支持5种方言及民汉互译,合计翻译方向多达1056个,显著拓展了离线翻译的应用边界。
深度集成:隐私安全与便捷体验并重
除了开源权重,该技术在真实场景中也展现出极高的实用性。在最新适配的演示版本中,模型支持“后台取词模式”,无论用户是在离线阅读邮件还是浏览本地网页,翻译功能都能即点即用。
更值得一提的是,翻译全过程在本地设备完成,不会上传任何个人隐私数据或进行云端收集,为对数据安全有极高要求的用户提供了可靠保障。目前,这一能力已在腾讯内部会议系统、办公软件与浏览器等多个核心业务场景落地。
为便于开发者与技术爱好者体验,相关模型已在Huggingface与魔搭社区同步上线。这意味着高精度翻译正加速从云端下沉到终端,让翻译真正成为随身可用、触手可达的基础工具。


















用户38505528 8个月前0
粘贴不了啊用户12648782 9个月前0
用法杂不对呢?yfarer 9个月前0
草稿id无法下载,是什么问题?