谷歌推出 DiffusionGemma：以文本扩散架构探索更快的 AI 推理-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌在当地时间 6 月 10 日正式发布了一款名为 DiffusionGemma 的实验性开源模型。它最大的特点，是采用了文本扩散架构（Text-to-text diffusion），希望通过一种新的技术路线来提升人工智能的内容生成效率。

从性能测试结果来看，DiffusionGemma体现出一定的技术亮点。依靠这一架构设计，该模型在专用 GPU 上的文本生成速度，与传统自回归大语言模型相比最高可提升 4 倍。不过，谷歌官方也给出了比较谨慎的说明，明确表示 DiffusionGemma 目前仍是一款面向研究人员和开发者的实验性模型。在生成质量上，它暂时还不能和标准版 Gemma4 相提并论，因此现阶段在生产环境中，官方依旧更推荐使用标准版本。

就应用场景而言，这种速度提升也有比较清晰的适用范围。它的优势主要体现在本地设备运行以及低并发推理场景中。如果是高并发的云端部署环境，那么这类架构所带来的加速效果就没有那么明显。

为了推动技术社区进一步研究和实践，谷歌还以 Apache 2.0 许可证对外开放了这一模型。这一做法让开发者能够以更低门槛进行技术验证，也为 AI 领域探索非自回归架构在推理效率上的潜力，提供了新的实验案例。虽然 DiffusionGemma 目前还处在早期探索阶段，但它依然为未来提升大模型推理效率带来了一条值得持续关注的新思路。