清华刘洋团队论文：揭示为何 70B 的医疗模型，反而不如 8B 会问诊丨ILCR 2026

2026-02-24 14:48:42

镜像现实MirageX

发布在

快讯

阅读：982

2026年2月，清华大学刘洋团队发布论文《DOCTOR-R1: Mastering Clinical Inquiry with Experiential Agentic Reinforcement Learning》，揭示了为何参数规模更大的医疗AI模型（如70B）在真实问诊中表现不如较小的模型（如8B）。研究表明，传统静态评测方式无法反映模型在动态临床场景中的能力，现有模型常因提问策略僵化、高风险信号反应迟钝等问题失效。DOCTOR-R1通过强化学习和部分可观测马尔可夫决策过程建模，在多轮问诊中展现出更优的提问策略与沟通能力，显著提升诊断准确性与安全性。研究强调真实临床能力需结合交互训练，并为医疗AI发展提供了新范式。

原文链接

本文链接：https://kx.umi6.com/article/33133.html

转载请注明文章出处

临床问诊