谷歌开源 Gemma 4：采用 Apache 2.0，31B 模型表现直追一线-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌开源 Gemma 4：采用 Apache 2.0，31B 模型表现直追一线

拥抱AI，AIGC最佳实践者

5713

4月3日清晨，Google DeepMind 发布了全新的开源模型家族 Gemma4。与上代相隔整一年，此次不仅带来明显的性能跨越，更把许可证彻底切换到全球通用的 Apache 2.0，让开发者在商用与二次开发上更自由。

全线覆盖：从手机端到工作站的“四大版本”

Gemma4 本次一次性带来四种规格，覆盖从端侧到高性能计算的多种场景：

31B Dense（旗舰版）：310亿全激活参数，支持 256K 超长上下文。在 Arena AI 开源榜上位居第三，未量化也能用单张 H100 跑通。

26B A4B MoE（性价比之王）：采用混合专家架构，总参数 252 亿，激活仅 38 亿。推理速度接近 4B 体量，但效果大幅优于同级产品，当前排名第六。

E4B & E2B（端侧精英）：面向手机与嵌入式设备深度优化。借助 Per-Layer Embeddings 技术，有效参数分别压缩至 45 亿与 23 亿，其中 E2B 在部分设备上内存占用可低至 1.5GB 以下。

性能猛进：代码与数学能力实现跨代提升

对比上一代 Gemma327B，Gemma4 在多项核心指标上取得大幅跃升：

数学竞赛：AIME2026 成绩从 20.8% 拉升至 89.2%。

编程能力：Codeforces ELO 从 110 增至 2150；在 LiveCodeBench 上由 29.1% 提升到 80.0%，跻身开源编程助手的第一梯队。

综合推理：研究生级科学问答（GPQA Diamond）从 42.4% 接近翻倍至 84.3%。

多语言能力：原生支持 140+ 语言，MMMLU 得分达 88.4%。

核心亮点：内置“思考模式”与 Agent 基因

Gemma4 不只是参数更大，交互与任务执行也更聪明，正向旗舰 Gemini 看齐：

Thinking Mode：提供可切换的“思考模式”，在给出答案前先进行内部推演，多步骤规划类任务更稳、更准。

原生 Agent 支持：支持函数调用与结构化 JSON 输出。谷歌同步推出开源 Agent 开发工具包（ADK），让端侧模型也能便捷打造“智能体”。

深度多模态：全系支持图像与视频输入，小型号还内置音频编码器，覆盖语音识别与翻译。

行业观察：开源赛道的“权力重组”

过去一年，国内开源模型（如 DeepSeek、Qwen、GLM 等）迭代飞快，谷歌在开源圈的存在感一度下降。Gemma4 的到来，表明谷歌正以“极致的端侧工程化”与“更彻底的协议开放”重回主战场。

结语：当大厂拿出“诚意”

从自定义协议转向 Apache2.0，谷歌用行动回应了开源的诚意。当 31B 规模的模型能逼近闭源旗舰表现，并可在消费级显卡甚至手机上流畅运行时，全球开发者的创作边界将再被拉宽。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐