谷歌进一步布局医疗AI开源：MedGemma 1.5提升影像理解，携手发布临床语音转写模型MedASR-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，谷歌发布了新一代开源医疗大模型 MedGemma 1.5，并同步推出面向临床场景的开源语音识别模型 MedASR，进一步完善其在医疗垂直领域的技术体系。

作为 Gemma 系列的医疗定制版本，MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献，还能结合 X 光、CT 等常见影像的描述性信息，辅助完成初步筛查与诊断推理。这一升级让 MedGemma 从纯文本问答工具，迈向多模态的临床决策支持系统，更贴合真实的医疗工作流程。

与此同时，MedASR 针对医生文书负担这一痛点给出解决方案。该模型专为医疗语音场景优化，能高精度识别医患沟通、查房记录、手术口述等专业内容，并自动转写为结构化文本，显著提升电子病历录入效率。谷歌强调，两款模型均基于去标识化的临床数据训练，严格遵循隐私保护规范，并以开源形式发布，面向全球研究者与开发者免费开放。

此次双模型发布，意味着谷歌在医疗 AI 领域正由“封闭服务”向“开放赋能”进一步深化。继 Gemini 医疗助手通过 HIPAA 合规认证后，开源模型的推出将继续降低医疗机构、初创公司及学术团队的创新门槛，推动 AI 在基层医疗、远程诊疗和科研分析等场景的普惠应用。

在医疗 AI 从“能用”走向“好用”的关键阶段，谷歌正以“开源+合规+多模态”的组合拳，构建一个兼具安全性、实用性与可扩展性的医疗 AI 生态底座。