标题:AI两天完成人类12年文献综述工作,准确率高出近15%
正文:
当人类科研人员还在翻阅上百个浏览器窗口时,AI已经大幅提升了文献综述的效率。医学领域中,传统的系统评价(SRs)平均耗时超16个月,成本高昂,且易导致无效或有害治疗的延续。多伦多大学和哈佛医学院等机构合作开发的AI端到端工作流程“otto-SR”,结合GPT-4.1和o3-mini模型,仅用两天就完成了需12年人类工作量的Cochrane系统评价更新。
基准测试显示,otto-SR在灵敏度(96.7% vs 81.7%)、特异度(93.9%)和数据提取准确率(93.1% vs 79.7%)上全面优于人类,同时发现54篇被遗漏的关键研究。在五项综述的评估中,otto-SR在摘要和全文筛选阶段均展现出更高的敏感性和特异性。
此外,otto-SR在七项综述的495项研究中表现出色,平均加权准确率达93.1%,远超双人评审员(79.7%)和商业工具Elicit(74.8%)。盲法评审进一步确认otto-SR的卓越性能。
针对Cochrane数据库的12篇综述复现表明,otto-SR不仅大幅缩短工作时间至48小时,还使符合条件的研究数量翻倍,新增64项研究。这项技术有望加速新疗法和公共卫生应对的速度,尤其惠及资源有限的地区。正如作者所言:“黄金标准已不再属于人类。”
原文链接
本文链接:https://kx.umi6.com/article/20325.html
转载请注明文章出处
相关推荐
换一换
2030年AI耗水量可达9.3 万亿升:够13亿非洲人用一年!
2026-06-04 19:19:05
特斯拉巨鲸廖凯原买入100万股英伟达 将再买100万股以支持紧张的市场
2026-03-04 18:04:30
亚洲首富只当了三天 孙正义是时代弄潮儿还是追泡沫的人?
2026-06-04 17:16:03
祖国人公开反对AI!称AI打心底反感人类
2026-06-07 14:40:43
Intel据悉将在5月启动第三轮调价 目标完成全年累计30%的涨幅
2026-04-03 16:11:41
连GitLab都开始裁程序员了
2026-06-04 17:12:53
赚翻了!小伙5个月用AI做120多个App:只需验收上架 90%都有付费用户
2026-02-14 12:16:24
微软AI CEO:未来18个月大量白领工作将被人工智能取代 这些职位先遭殃
2026-02-14 15:24:19
高盛:AI去年对美国GDP贡献几乎为零
2026-02-24 16:56:59
黄仁勋劝应届生不要害怕AI:未来年轻人将有大量机会
2026-05-11 09:59:43
一道50米洗车题让全网AI翻车!实测:豆包元宝等国产大模型都懵逼了 仅Gemini秒懂
2026-02-11 17:35:22
大模型的尽头 怎么是费大厨辣椒炒肉?
2026-05-24 15:42:37
库克亲自掌舵!一场会议改写苹果AI发展走向
2026-06-09 00:53:08
707 文章
628622 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41