标题:AI两天完成人类12年文献综述工作,准确率高出近15%
正文:
当人类科研人员还在翻阅上百个浏览器窗口时,AI已经大幅提升了文献综述的效率。医学领域中,传统的系统评价(SRs)平均耗时超16个月,成本高昂,且易导致无效或有害治疗的延续。多伦多大学和哈佛医学院等机构合作开发的AI端到端工作流程“otto-SR”,结合GPT-4.1和o3-mini模型,仅用两天就完成了需12年人类工作量的Cochrane系统评价更新。
基准测试显示,otto-SR在灵敏度(96.7% vs 81.7%)、特异度(93.9%)和数据提取准确率(93.1% vs 79.7%)上全面优于人类,同时发现54篇被遗漏的关键研究。在五项综述的评估中,otto-SR在摘要和全文筛选阶段均展现出更高的敏感性和特异性。
此外,otto-SR在七项综述的495项研究中表现出色,平均加权准确率达93.1%,远超双人评审员(79.7%)和商业工具Elicit(74.8%)。盲法评审进一步确认otto-SR的卓越性能。
针对Cochrane数据库的12篇综述复现表明,otto-SR不仅大幅缩短工作时间至48小时,还使符合条件的研究数量翻倍,新增64项研究。这项技术有望加速新疗法和公共卫生应对的速度,尤其惠及资源有限的地区。正如作者所言:“黄金标准已不再属于人类。”
原文链接
本文链接:https://kx.umi6.com/article/20325.html
转载请注明文章出处
相关推荐
.png)
换一换
库克你赶紧退休,放过苹果吧
2025-07-08 15:51:49
百度反思!李彦宏承认不是所有的game百度都能玩赢
2025-07-09 16:07:25
Intel前CEO基辛格承认:低估了AI的影响、让公司难以追赶
2025-07-06 11:11:49
多家科创板公司释放中报预增信号:AI成电子产业增长关键词 创新成果及募投项目效益显现
2025-07-02 21:45:15
AI也有幸运数字!从1-50随机选数字:各家答案竟惊人一致
2025-07-02 19:10:00
腾讯VS网易,从拼游戏到拼AI
2025-08-14 21:02:49
谷歌:AI未引起搜索引擎流量下滑
2025-08-07 14:52:28
Meta股价创新高!扎克伯格“官宣”超级智能实验室 11人豪华团队首曝光
2025-07-01 09:19:38
IT、算法靠边站!零一万物创始人称未来公司最重要岗位是HR
2025-07-04 12:46:17
三星成立InnoX Lab 负责推进AI、人形机器人等未来业务
2025-08-04 17:05:04
AI时代,人的前景很乐观
2025-08-26 19:54:46
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
美国现在最贵的,是中国AI 人才:清北中科大学霸正在“统治”硅谷AI 圈
2025-07-02 19:44:10
463 文章
160280 浏览
24小时热文
更多

-
2025-09-06 22:39:24
-
2025-09-06 21:38:26
-
2025-09-06 20:38:03