医疗AI再进阶!南洋理工推出首个电子病历处理评测基准

在当今医疗体系中,电子病历(EHR)是最核心的数据载体,记录患者从诊断到治疗的关键信息。这些数据既为临床决策提供依据,也推动医疗人工智能不断前进。南洋理工大学团队近日推出了首个系统化评测大型语言模型(LLM)处理电子病历能力的基准——EHRStruct,被视为医疗 AI 研究的重要一步。

EHRStruct 覆盖 11 项核心任务,共 2200 个样本。任务设计紧贴临床场景、认知层级与功能类别,构建出一套严谨的评测体系。研究显示,通用型大模型在处理结构化 EHR 时表现亮眼,甚至优于部分医学专用模型。同时,数据驱动任务更占优势,输入格式与微调方式也会显著影响模型效果。

在评测中,团队对 20 个主流的 LLM 与 11 种增强方案进行了系统比较。将 EHRMaster 框架与 Gemini 结合后,模型在结构化 EHR 任务上的表现大幅提升,甚至超过了当前最先进的模型。该研究已被 AAAI 2026 录用,预计将在后续学术交流中引发广泛关注。

为进一步推动该领域发展,研究团队同步发起了“EHRStruct 2026 – LLM 结构化电子病历挑战赛”,为研究者提供统一、可对比的评测平台,促进对 LLM 在结构化电子病历处理能力上的深入研究。

EHRStruct 的建设流程可分为四个阶段:任务合成、任务体系构建、任务样本抽取和评测流程搭建。医学专家与计算机科学家协同合作,确保评测既具临床相关性,又可重复验证。该评测框架不仅科学严谨,也为后续研究提供了充足的数据支撑。

这项重要成果的发布,不仅为医疗 AI 发展带来新的工具与方法,也将为临床决策与数据分析提供更可靠的支持。期待更多医疗 AI 应用加速落地,助力医疗服务更高效。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享