11月9日,研究人员测试谷歌AI模型Veo-3生成手术视频的能力,发现其虽能生成逼真画面,但缺乏医学逻辑理解。研究使用SurgVeo基准评测,涵盖50段真实手术视频,由4名外科医生评分。结果显示,Veo-3在腹腔手术中视觉合理性初评3.72分,但器械操作和手术逻辑性分别仅1.78分和1.61分;神经外科表现更差,手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题,如虚构器械或违反生理规律。提供更多上下文未显著改善结果,表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进,并警示此类AI用于医学培训可能误导医学生或手术机器人,强调现有系统远未达到安全应用标准。
原文链接
本文链接:https://kx.umi6.com/article/28056.html
转载请注明文章出处
相关推荐
换一换
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
2025-01-21 11:36:22
AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
2025-11-13 19:14:35
行业景气度走高!SK暂缓出让晶圆厂商SK Siltron
2026-06-04 20:22:35
蚂蚁集团推出海外AI支付解决方案 商户可实现全球智能体运营
2026-06-08 19:40:56
2026年全国统一高考今天开考:新增AI监考员、智能眼镜带入即作弊
2026-06-07 07:21:05
智源&清华合作成果登上Science:脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
2026-06-05 19:13:44
CVPR 开幕式:全场泪目缅怀孙剑,广工本科生靠「古董显卡」逆袭 | CVPR 2026
2026-06-08 11:22:26
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
LG砸重金采购万片英伟达GPU 全速冲刺AI转型
2026-06-07 23:56:41
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
GitHub 被AI打穿了
2026-06-05 19:15:06
国星宇航与腾讯云签署“星算”计划战略合作协议,携手领航AI云服务新生态
2026-06-05 18:10:37
737 文章
673016 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08