标题:AI两天完成人类12年文献综述工作,准确率高出近15%
正文:
当人类科研人员还在翻阅上百个浏览器窗口时,AI已经大幅提升了文献综述的效率。医学领域中,传统的系统评价(SRs)平均耗时超16个月,成本高昂,且易导致无效或有害治疗的延续。多伦多大学和哈佛医学院等机构合作开发的AI端到端工作流程“otto-SR”,结合GPT-4.1和o3-mini模型,仅用两天就完成了需12年人类工作量的Cochrane系统评价更新。
基准测试显示,otto-SR在灵敏度(96.7% vs 81.7%)、特异度(93.9%)和数据提取准确率(93.1% vs 79.7%)上全面优于人类,同时发现54篇被遗漏的关键研究。在五项综述的评估中,otto-SR在摘要和全文筛选阶段均展现出更高的敏感性和特异性。
此外,otto-SR在七项综述的495项研究中表现出色,平均加权准确率达93.1%,远超双人评审员(79.7%)和商业工具Elicit(74.8%)。盲法评审进一步确认otto-SR的卓越性能。
针对Cochrane数据库的12篇综述复现表明,otto-SR不仅大幅缩短工作时间至48小时,还使符合条件的研究数量翻倍,新增64项研究。这项技术有望加速新疗法和公共卫生应对的速度,尤其惠及资源有限的地区。正如作者所言:“黄金标准已不再属于人类。”
原文链接
本文链接:https://kx.umi6.com/article/20325.html
转载请注明文章出处
相关推荐
换一换
在AI面前,人类终于不说谎了
2025-12-25 18:52:01
AI 正降低创业门槛,15 岁高中生独立创办科技公司
2025-12-22 15:48:24
阿里的真正考验,是即将到来的「天王山之战」
2025-11-27 09:26:57
知乎发布2025年Q3财报:营收6.59亿,全年盈利可期
2025-11-25 17:59:29
OpenAI的「梦醒时分」
2025-12-09 15:41:20
伦敦市长警告:若放任 AI 失控发展,就业环境恐被大规模摧毁
2026-01-19 08:21:30
高盛:2026年别只盯着AI 更看好医疗保健和海外股票
2025-11-27 14:41:21
美图历险记
2025-11-27 09:24:34
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
阿里正陷入全面竞争的陷阱
2025-11-25 16:57:43
AI做日本高考题9科得满分
2026-01-20 22:34:54
火山引擎相关人士回应“豆包比价”是否会提高字节产品权重:不会
2025-12-18 19:08:28
Soul四渡赤水:赴港IPO是场必须打赢的翻身仗
2025-12-19 18:03:29
619 文章
404503 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55