标题:CX-Mind发布:胸片诊断迈入“可验证推理”时代
上海交通大学、创智学院与瑞金医院联合推出CX-Mind,这是首个将胸片诊断推进至“可验证推理链”的多模态大模型。它不仅提供诊断结果,还生成清晰的推理路径,每一步都基于影像证据支撑,满足临床医生复核需求。
为什么重要?
胸部X光是临床常见检查,但传统AI仅输出标签或报告,缺乏解释能力,难以融入核心诊疗流程。医生需要了解诊断依据、排除了哪些可能、结论是否可靠。CX-Mind通过“交错式推理”(interleaved reasoning),将医学影像AI从“黑箱工具”转变为医生的协作伙伴。
三大突破
1. 重新定义输出范式
CX-Mind采用交错式推理,先观察影像征象,再形成假设并鉴别,最后生成结论。这种模式更贴近真实阅片过程,并通过训练让可解释性成为模型的核心约束。
-
构建专家能力谱系
团队开发了大规模数据集CX-Set,包含70万张影像和260万条指令样本,涵盖视觉理解、文本生成和时空对齐三大能力域,确保模型具备完整的诊断工作流能力。 -
强化学习优化路径
CX-Mind提出CuRL-VPR方法,结合课程学习与过程奖励机制,不仅关注最终答案正确性,还核查每步推理是否有影像证据支持,显著提升诊断可靠性。
评测表现
在横跨23个数据集、70万张影像的测试中,CX-Mind在视觉理解、报告生成和时空对齐三大领域平均提升25.1%。在真实世界测试集Rui-CXR上,其多中心医生评估五项维度均排名第一。
未来影响
CX-Mind推动医学AI从“视觉模型”向“推理模型”转型,为胸部CT、MRI等复杂场景奠定基础。尽管临床部署仍需进一步验证,但它已明确下一代医学AI方向:推理清晰、证据可复核、过程可协作。
论文链接:https://doi.org/10.1016/j.inffus.2025.104027
GitHub:https://github.com/SII-WenjieLisjtu/CX-Mind
HuggingFace:https://huggingface.co/SII-JasperLi77/CX-Mind
-
2026-05-19 12:31:57 -
2026-05-19 12:29:51 -
2026-05-19 11:30:34