11月9日,研究人员测试谷歌AI模型Veo-3生成手术视频的能力,发现其虽能生成逼真画面,但缺乏医学逻辑理解。研究使用SurgVeo基准评测,涵盖50段真实手术视频,由4名外科医生评分。结果显示,Veo-3在腹腔手术中视觉合理性初评3.72分,但器械操作和手术逻辑性分别仅1.78分和1.61分;神经外科表现更差,手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题,如虚构器械或违反生理规律。提供更多上下文未显著改善结果,表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进,并警示此类AI用于医学培训可能误导医学生或手术机器人,强调现有系统远未达到安全应用标准。
原文链接
本文链接:https://kx.umi6.com/article/28056.html
转载请注明文章出处
相关推荐
换一换
研究显示谷歌 AI 模型 Veo-3 可生成逼真手术视频,但缺乏实质性医学理解
2025-11-09 19:41:04
AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
2025-11-13 19:14:35
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
2025-01-21 11:36:22
苹果首款AI穿戴设备最早可能在2027年发布
2026-01-22 18:06:16
国家电网的供应商冲击IPO,左手能源右手机器人
2026-01-22 13:57:42
百度发布文心大模型5.0正式版
2026-01-22 10:49:05
OpenAI 与盖茨基金会将向非洲投资 5000 万美元,利用 AI 改善医疗体系
2026-01-21 15:16:32
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
工信部:将发布人形机器人与具身智能综合标准化体系建设指南
2026-01-21 12:07:04
事关AI聊天机器人和自动驾驶!马斯克和奥尔特曼隔空互喷
2026-01-21 20:25:45
全球首个AI美女演员诞生!星爵演员破大防怒喷
2026-01-21 23:30:59
黄仁勋谈AI泡沫:泡沫产生是因为投资规模空前庞大 巨额投资是为了构建AI基础设施
2026-01-22 16:01:49
苏州“十五五”规划建议:深化投融资体制改革,积极发展股权、债券等直接融资
2026-01-21 20:29:06
645 文章
433068 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44