综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,南洋理工大学发布首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的基准EHRStruct。该基准由计算机科学家与医学专家联合构建,涵盖11项核心任务、2,200个标准化样本,按临床场景和认知层级分类,为医疗AI提供严谨评测框架。研究团队对20个主流LLM及11种增强方法进行评测,并提出代码增强框架EHRMaster,显著提升性能,尤其在数据驱动任务中表现优异。研究成果已被AAAI 2026录取为Oral论文,并同步推出EHRStruct 2026挑战赛,供全球研究者对比模型能力。Leaderboard已在Codabench上线,推动LLM在医疗领域的应用探索。
原文链接
加载更多
暂无内容