1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年12月,蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证评测框架GAPS(Grounding, Adequacy, Perturbation, Safety),聚焦肺癌领域,包含92个问题和1691个临床要点。该框架通过全自动化的评测工具链,首次系统评估AI医疗模型的循证决策能力、回答完备性、鲁棒性与安全性,填补了现有医疗AI评测的空白。研究显示,主流大模型在事实记忆上表现优异,但在不确定性推理和临床完备性方面存在明显短板。GAPS为医疗AI从“技术驱动”向“临床价值驱动”转型提供了重要标准,其评测集与自动化框架已全面公开,未来可扩展至心血管、儿科等更多专科领域。论文与相关资源已在arXiv和Hugging Face平台发布。

原文链接
本文链接:https://kx.umi6.com/article/30914.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国500万医生的新AI:顶刊独家联手,卷的就是证据源
2026-05-16 13:36:05
百川发布循证增强大模型 M2 Plus,号称“医生版 ChatGPT”
2025-10-22 14:45:56
Anthropic高管:公司90%代码已由AI完成 白领工作重心转向监督
2026-05-14 21:00:46
机构:到2028年 AI服务器将占DRAM需求的55%
2026-05-14 16:49:19
亚历山大王回应一切:LeCun、Manus,“我的父母都是中国人”
2026-05-14 15:42:21
蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强
2026-05-15 15:50:38
广东:支持人工智能等新兴未来产业领域OPC发展
2026-05-15 16:57:42
塑料兄弟情!OpenAI怒斥苹果草率应付合作 反被苹果控诉挖走40名大将
2026-05-15 16:56:33
机构:预估2030年Micro LED CPO光收发模块产值达8.48亿美元
2026-05-15 12:46:38
烽火通信:成功研制13824芯超大芯数光缆并已量产
2026-05-15 14:50:22
腾讯开源Agent Memory
2026-05-14 17:53:47
三星电子开发下一代HBM封装技术 或用于智能手机等移动设备
2026-05-15 12:45:32
中信建投:下半年A股将演绎结构性慢牛行情
2026-05-14 08:27:56
24小时热文
更多
扫一扫体验小程序