综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月,清华大学刘洋团队发布论文《DOCTOR-R1: Mastering Clinical Inquiry with Experiential Agentic Reinforcement Learning》,揭示了为何参数规模更大的医疗AI模型(如70B)在真实问诊中表现不如较小的模型(如8B)。研究表明,传统静态评测方式无法反映模型在动态临床场景中的能力,现有模型常因提问策略僵化、高风险信号反应迟钝等问题失效。DOCTOR-R1通过强化学习和部分可观测马尔可夫决策过程建模,在多轮问诊中展现出更优的提问策略与沟通能力,显著提升诊断准确性与安全性。研究强调真实临床能力需结合交互训练,并为医疗AI发展提供了新范式。
原文链接
加载更多
暂无内容