1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年12月,蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证评测框架GAPS(Grounding, Adequacy, Perturbation, Safety),聚焦肺癌领域,包含92个问题和1691个临床要点。该框架通过全自动化的评测工具链,首次系统评估AI医疗模型的循证决策能力、回答完备性、鲁棒性与安全性,填补了现有医疗AI评测的空白。研究显示,主流大模型在事实记忆上表现优异,但在不确定性推理和临床完备性方面存在明显短板。GAPS为医疗AI从“技术驱动”向“临床价值驱动”转型提供了重要标准,其评测集与自动化框架已全面公开,未来可扩展至心血管、儿科等更多专科领域。论文与相关资源已在arXiv和Hugging Face平台发布。

原文链接
本文链接:https://kx.umi6.com/article/30914.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
百川发布循证增强大模型 M2 Plus,号称“医生版 ChatGPT”
2025-10-22 14:45:56
中国500万医生的新AI:顶刊独家联手,卷的就是证据源
2026-05-16 13:36:05
谷歌「推理之王」也跑路Meta了,当年还是李飞飞挖来的
2026-06-26 16:13:11
高通发明全新HBC内存架构:带宽提升54倍!还不烫手
2026-06-26 12:08:24
市场份额从41%掉到26%,Cursor凭什么还值600亿?
2026-06-29 15:42:05
Agent刚拿到自己的邮箱和钱包 人类的收件箱已经挤爆了
2026-06-30 20:39:33
黄仁勋访中韩独漏日本!原因披露:日企手握25万亿日元却不敢下注AI
2026-06-26 15:13:56
全球首个:隐空间世界模型,打通长时序双向物理因果链了!
2026-06-29 22:52:00
三体问世20周年,光帆科技与三体宇宙联合发布联名款AI全感穿戴设备及重磅视频《破晓》
2026-06-25 18:31:26
24小时直播,只靠一张照片?虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙
2026-06-30 14:24:50
7 年 Google 老兵写出爆款工具被开除,转头官方发同款?OpenClaw 之父下场抢人
2026-06-25 11:14:57
4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?
2026-06-25 16:27:58
库克临走给苹果涨价!电脑iPad全线上调,iPhone 18也跑不了
2026-06-26 09:58:37
24小时热文
更多
扫一扫体验小程序