11月9日,研究人员测试谷歌AI模型Veo-3生成手术视频的能力,发现其虽能生成逼真画面,但缺乏医学逻辑理解。研究使用SurgVeo基准评测,涵盖50段真实手术视频,由4名外科医生评分。结果显示,Veo-3在腹腔手术中视觉合理性初评3.72分,但器械操作和手术逻辑性分别仅1.78分和1.61分;神经外科表现更差,手术逻辑性评分低至1.13分。超93%错误源于医学逻辑问题,如虚构器械或违反生理规律。提供更多上下文未显著改善结果,表明模型缺乏医学推理能力。团队计划开源SurgVeo数据集以推动改进,并警示此类AI用于医学培训可能误导医学生或手术机器人,强调现有系统远未达到安全应用标准。
原文链接
本文链接:https://kx.umi6.com/article/28056.html
转载请注明文章出处
相关推荐
换一换
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
2025-01-21 11:36:22
AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
2025-11-13 19:14:35
联检科技等成立新公司 含AI及物联网业务
2026-04-24 15:19:39
国家人工智能产业投资基金等入股黑湖科技
2026-04-23 11:03:52
SK海力士完成采购项目的招标 涉及250台人工智能服务器
2026-04-23 16:18:31
摩尔线程Day-0适配DeepSeek-V4
2026-04-24 18:28:12
新模型上线期间出现功能异常 月之暗面公布补偿方案:全员额度重置
2026-04-22 22:32:08
赛力斯申请注册天行平台商标
2026-04-23 14:10:41
漫展误用AI元素 长虹电视道歉:立即下架重绘
2026-04-24 06:55:41
千问总裁吴嘉:“AI办事”对外开放 首家接入东方航空
2026-04-23 11:02:47
特斯拉CEO马斯克:预计未来AI芯片将严重不足
2026-04-23 11:06:01
行业景气度高位运行 光模块企业扩产忙
2026-04-23 07:55:30
海亮科服成为浙江首家教育科技独角兽
2026-04-23 16:17:26
715 文章
583624 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26