2025年12月,南洋理工大学发布首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的基准EHRStruct。该基准由计算机科学家与医学专家联合构建,涵盖11项核心任务、2,200个标准化样本,按临床场景和认知层级分类,为医疗AI提供严谨评测框架。研究团队对20个主流LLM及11种增强方法进行评测,并提出代码增强框架EHRMaster,显著提升性能,尤其在数据驱动任务中表现优异。研究成果已被AAAI 2026录取为Oral论文,并同步推出EHRStruct 2026挑战赛,供全球研究者对比模型能力。Leaderboard已在Codabench上线,推动LLM在医疗领域的应用探索。
原文链接
本文链接:https://kx.umi6.com/article/30265.html
转载请注明文章出处
相关推荐
换一换
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
2025-11-01 13:29:57
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷
2024-06-10 21:37:45
AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!
2024-10-30 16:13:15
我国首个心血管专科医疗大模型“观心”发布:自动生成电子病历,顶尖医生经验辅助诊断
2025-02-27 16:30:34
LLM数据短缺危机:2028年或耗尽文本资源
2024-06-14 22:27:49
LLM 的“母语”是什么?
2024-06-03 07:50:10
MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
2025-06-11 17:15:11
只因一个“:”,大模型全军覆没
2025-07-15 17:47:42
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
2024-06-10 18:37:26
拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了
2025-10-27 15:06:03
Claude 4登陆Amazon Bedrock
2025-05-27 18:22:21
医疗 AI 迎来大考,南洋理工发布首个 LLM 电子病历处理评测
2025-12-15 22:01:14
强化学习之父:LLM主导只是暂时,扩展计算才是正解
2025-06-10 18:52:34
580 文章
344542 浏览
24小时热文
更多
-
2025-12-16 01:11:08 -
2025-12-15 23:04:58 -
2025-12-15 23:03:48