1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年12月,南洋理工大学发布首个全面评测大型语言模型(LLM)处理结构化电子病历(EHR)能力的基准EHRStruct。该基准由计算机科学家与医学专家联合构建,涵盖11项核心任务、2,200个标准化样本,按临床场景和认知层级分类,为医疗AI提供严谨评测框架。研究团队对20个主流LLM及11种增强方法进行评测,并提出代码增强框架EHRMaster,显著提升性能,尤其在数据驱动任务中表现优异。研究成果已被AAAI 2026录取为Oral论文,并同步推出EHRStruct 2026挑战赛,供全球研究者对比模型能力。Leaderboard已在Codabench上线,推动LLM在医疗领域的应用探索。

原文链接
本文链接:https://kx.umi6.com/article/30265.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
2025-06-24 17:19:19
MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
2025-06-11 17:15:11
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷
2024-06-10 21:37:45
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
2024-08-19 12:33:58
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
2025-01-11 15:37:55
英伟达推出通用深度研究系统,可接入任何LLM,支持个人定制
2025-09-08 13:59:39
AI 编程能力哪家强?阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员
2025-01-04 14:16:12
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
2024-11-16 19:35:47
Claude新指南,教你构建属于自己的智能体
2024-12-24 10:31:53
Agent是“新瓶装旧酒”,氛围编码不值得尝试?
2025-05-08 14:32:22
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
2025-04-21 12:38:13
英伟达最新技术分享:手把手教你用 Llama 3.1 合成数据改进模型!附代码
2024-07-29 17:59:43
24小时热文
更多
扫一扫体验小程序