1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

蚂蚁集团联合研究团队发布了一款名为MedResearcher-R1的医学AI智能体,凭借仅2100条训练样本,在权威医疗基准测试MedBrowseComp中将复杂医疗任务的准确回答数量提升至27.5,刷新纪录并超越o3、Gemini 2.5 Pro等通用大模型,突破了此前25.5的业界“卡点”。

MedResearcher-R1的成功源于三大创新:数据生成、工具设计和训练方法。首先,它通过“知识指引下的轨迹合成框架(KISA)”,从3000万篇医学文献中提炼出复杂的多步推理问题,训练AI像医学专家一样逐步验证答案。其次,它配备了专属“工具箱”,直接连接国际医疗指南、核心期刊等权威数据源,避免公开网络信息的干扰。最后,采用“蒙版轨迹引导”技术,隐藏关键实体信息,逼迫AI主动调用工具完成推理,而非简单“背诵”答案。

此外,MedResearcher-R1不仅在医疗领域表现出色,在通用AI测试中也表现优异,打破了“专业模型只能干一行”的刻板印象。研究表明,小规模模型通过精准设计,同样能在垂直领域实现“以小博大”。

研究团队已将MedResearcher-R1的代码和数据集开源,旨在推动全球协同创新,加速开发下一代AI工具,助力医疗研究效率与质量提升。

官网链接:https://chat.antaq.com/
报告地址:https://arxiv.org/abs/2508.14880

原文链接
本文链接:https://kx.umi6.com/article/24412.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
哈佛学生靠医疗“ChatGPT”,成了亿万富翁
2025-08-29 10:37:54
全民AI健康管家来了!实测蚂蚁AQ:追问识药看皮肤,连医院接硬件
2025-06-30 13:42:50
2024医疗人工智能:生成式AI爆发,医疗AI走到新的十字路口
2024-10-18 15:49:32
DeepSeek横空出世,医疗AI迎来「国运时刻」
2025-02-10 09:00:10
国内首个!夸克健康大模型通过副主任医师职称考试
2025-05-27 15:53:40
当AI进入「哑巴儿科」,能大力出奇迹吗?
2025-04-25 15:16:54
DeepSeek何以把医疗界搅翻天?
2025-03-07 09:38:49
完全把命交给AI 还不是时候
2025-05-27 08:12:07
蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据
2025-03-12 17:31:48
智慧医院“中国方案”走向全球
2025-08-01 09:01:36
百度押注的医疗AI公司冲刺IPO
2025-07-10 11:18:44
2025WAIC:大厂回归,医疗AI爆火出圈
2025-07-30 15:47:42
蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录
2025-08-29 13:39:01
24小时热文
更多
扫一扫体验小程序