谷歌深化医疗AI开源布局：MedGemma 1.5提升影像理解，同步上线医疗语音模型MedASR-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，谷歌正式发布新一代开源医疗大模型 MedGemma 1.5，并同步推出面向临床场景的开源语音识别模型 MedASR，进一步完善其在医疗垂直领域的技术布局。

作为 Gemma 系列的医疗定制版本，MedGemma 1.5 在前代基础上大幅增强医学影像的理解与分析能力。该模型不仅能处理病历文本、检验报告和医学文献，还可结合 X 光、CT 等常见影像的描述信息，辅助完成初步筛查与诊断推理。这一升级让 MedGemma 从纯文本问答工具，迈向多模态临床决策支持系统，更贴近真实医疗流程。

与此同时，MedASR 直面医生文书负担这一痛点。该模型针对医疗语音场景优化，可高精度识别医患对话、查房记录、手术口述等专业内容，并自动转写为结构化文本，显著提升电子病历录入效率。谷歌强调，两款模型均基于去标识化的临床数据训练，严格遵循隐私保护规范，并以开源形式发布，供全球研究者与开发者免费使用。

此次双模型发布，标志着谷歌在医疗 AI 领域从“封闭服务”走向“开放赋能”的战略进一步深化。继 Gemini 医疗助手通过 HIPAA 合规认证后，开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛，推动 AI 在基层医疗、远程诊疗和科研分析等场景的普惠应用。

在医疗 AI 从“可用”迈向“好用”的关键阶段，谷歌正以“开源+合规+多模态”的组合拳，打造兼具安全性、实用性与可扩展性的医疗 AI 生态底座。