新研究显示,OpenAI的o1-preview AI模型在诊断复杂医疗案例方面表现优于人类医生。研究发现,o1-preview正确诊断了78.3%的测试案例,在特定案例对比测试中的准确率高达88.6%,显著高于GPT-4的72.9%。使用R-IDEA评估标准,o1-preview在80个案例中取得78个满分,而经验丰富的医生和住院医生分别只在28和16个案例中获得满分。在复杂案例得分中,o1-preview得分86%,远超使用GPT-4的医生(41%)和使用传统工具的医生(34%)。不过,研究者指出测试存在局限性,且o1-preview的诊断测试成本较高。此研究由哈佛医学院和斯坦福大学团队完成,发布时间为12月25日。
原文链接
本文链接:https://kx.umi6.com/article/10729.html
转载请注明文章出处
相关推荐
换一换
黑客能让 AI 发辞职信?OpenAI 承认 Atlas 浏览器提示词注入攻击难以根治
2025-12-23 07:24:44
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了
2025-12-12 14:51:53
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
OpenAI 想赢的不是下一次发布会,而是下一代入口
2025-12-19 21:10:33
免费用:OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员
2025-12-17 08:27:39
OpenAI和Anthropic寻求更多办公空间以在欧洲扩张
2025-12-18 16:58:01
OpenAI:将自行承担“星际之门”项目能源费用,确保不会推高电价
2026-01-21 13:12:22
OpenAI 升级 ChatGPT AI 助理,优先保护未成年人安全
2025-12-19 08:37:19
OpenAI 通信一把手 Hannah Wong 明年交棒,曾主导化解“奥尔特曼被罢免”公关危机
2025-12-16 14:46:45
迪士尼官宣 10 亿美元投资 OpenAI,允许 Sora 生成米老鼠等角色视频
2025-12-11 23:15:43
OpenAI 新功能曝光:代号“奏鸣曲”,猜测与 ChatGPT 音频体验有关
2026-01-19 19:09:37
“红色警报”奏效吗 OpenAI称霸企业级AI市场 碾压谷歌
2026-01-16 19:53:11
595 文章
377535 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45