谷歌发布 TranslateGemma 翻译模型,手机也能轻松上手

随着 AI 技术持续演进,谷歌在1月15日推出了全新 TranslateGemma 翻译模型系列。该系列基于其最新的 Gemma3 架构,提供 4B、12B、27B 三种参数规模,覆盖 55 种核心语言,并支持多模态图像翻译。也就是说,用户不仅能翻译纯文本,还能识别并翻译图片中的文字,实现更加顺畅的跨语言交流。

谷歌表示,TranslateGemma 不只是一次常规更新,而是性能上的大幅跃升。在严格的 WMT24++ 基准测试中,12B 版本的翻译质量竟超越了 27B 基线模型,尽管后者参数量是它的两倍。这意味着开发者用更少的算力,就能获得更高保真的译文,显著提升效率与响应速度。

image.png

更值得一提的是,体量最小的 4B 模型也十分给力,表现与 12B 模型相当,尤其适用于移动端和边缘设备。这让更多人能在日常出行、学习与工作场景中,轻松获得高质量的翻译体验。

在技术实现上,TranslateGemma 的高效来自独特的“两阶段微调”。第一阶段使用高质量的合成数据与人工译文进行监督微调;第二阶段引入强化学习,由先进的奖励模型引导模型生成更自然、更符合语境的译文。这一方法为机器翻译带来新的思路与实践。

image.png

为了覆盖不同使用场景,谷歌将 TranslateGemma 划分为多种尺寸:4B 模型针对手机与边缘设备做了优化;12B 模型适配消费级笔记本;而 27B 模型则面向追求极致翻译质量的用户,可在高端 GPU 或云端 TPU 上运行。

目前,全部模型已在 Kaggle、Hugging Face 和 Vertex AI 平台上线,开发者与研究者都可下载使用。随着 TranslateGemma 的发布,谷歌再一次展示了其在 AI 领域的领先实力,并为未来的语言翻译打开更多可能。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享