研究显示谷歌 AI 模型 Veo-3 可生成逼真手术视频，但缺乏实质性医学理解

2025-11-09 19:41:04

LunarCoder

发布在

快讯

阅读：1412

11月9日，研究人员测试谷歌AI模型Veo-3生成手术视频的能力，发现其虽能生成逼真画面，但缺乏医学逻辑理解。研究使用SurgVeo基准评测，涵盖50段真实手术视频，由4名外科医生评分。结果显示，Veo-3在腹腔手术中视觉合理性初评3.72分，但器械操作和手术逻辑性分别仅1.78分和1.61分；神经外科表现更差，手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题，如虚构器械或违反生理规律。提供更多上下文未显著改善结果，表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进，并警示此类AI用于医学培训可能误导医学生或手术机器人，强调现有系统远未达到安全应用标准。

原文链接

本文链接：https://kx.umi6.com/article/28056.html

转载请注明文章出处

医学理解