谷歌深化医疗AI开源布局:MedGemma 1.5提升影像理解,同步上线医疗语音模型MedASR

近日,谷歌正式发布新一代开源医疗大模型 MedGemma 1.5,并同步推出面向临床场景的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术布局。

作为 Gemma 系列的医疗定制版本,MedGemma 1.5 在前代基础上大幅增强医学影像的理解与分析能力。该模型不仅能处理病历文本、检验报告和医学文献,还可结合 X 光、CT 等常见影像的描述信息,辅助完成初步筛查与诊断推理。这一升级让 MedGemma 从纯文本问答工具,迈向多模态临床决策支持系统,更贴近真实医疗流程。

与此同时,MedASR 直面医生文书负担这一痛点。该模型针对医疗语音场景优化,可高精度识别医患对话、查房记录、手术口述等专业内容,并自动转写为结构化文本,显著提升电子病历录入效率。谷歌强调,两款模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,供全球研究者与开发者免费使用。

此次双模型发布,标志着谷歌在医疗 AI 领域从“封闭服务”走向“开放赋能”的战略进一步深化。继 Gemini 医疗助手通过 HIPAA 合规认证后,开源模型的推出将进一步降低医疗机构、初创公司及学术团队的创新门槛,推动 AI 在基层医疗、远程诊疗和科研分析等场景的普惠应用。

在医疗 AI 从“可用”迈向“好用”的关键阶段,谷歌正以“开源+合规+多模态”的组合拳,打造兼具安全性、实用性与可扩展性的医疗 AI 生态底座。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享