谷歌进一步布局医疗AI开源:MedGemma 1.5提升影像理解,携手发布临床语音转写模型MedASR

近日,谷歌发布了新一代开源医疗大模型 MedGemma 1.5,并同步推出面向临床场景的开源语音识别模型 MedASR,进一步完善其在医疗垂直领域的技术体系。

作为 Gemma 系列的医疗定制版本,MedGemma 1.5 在前代基础上显著增强了对医学影像的理解与分析能力。该模型不仅能处理文本病历、检验报告和医学文献,还能结合 X 光、CT 等常见影像的描述性信息,辅助完成初步筛查与诊断推理。这一升级让 MedGemma 从纯文本问答工具,迈向多模态的临床决策支持系统,更贴合真实的医疗工作流程。

与此同时,MedASR 针对医生文书负担这一痛点给出解决方案。该模型专为医疗语音场景优化,能高精度识别医患沟通、查房记录、手术口述等专业内容,并自动转写为结构化文本,显著提升电子病历录入效率。谷歌强调,两款模型均基于去标识化的临床数据训练,严格遵循隐私保护规范,并以开源形式发布,面向全球研究者与开发者免费开放。

此次双模型发布,意味着谷歌在医疗 AI 领域正由“封闭服务”向“开放赋能”进一步深化。继 Gemini 医疗助手通过 HIPAA 合规认证后,开源模型的推出将继续降低医疗机构、初创公司及学术团队的创新门槛,推动 AI 在基层医疗、远程诊疗和科研分析等场景的普惠应用。

在医疗 AI 从“能用”走向“好用”的关键阶段,谷歌正以“开源+合规+多模态”的组合拳,构建一个兼具安全性、实用性与可扩展性的医疗 AI 生态底座。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享