1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:AI两天完成人类12年文献综述工作,准确率高出近15%

正文:

当人类科研人员还在翻阅上百个浏览器窗口时,AI已经大幅提升了文献综述的效率。医学领域中,传统的系统评价(SRs)平均耗时超16个月,成本高昂,且易导致无效或有害治疗的延续。多伦多大学和哈佛医学院等机构合作开发的AI端到端工作流程“otto-SR”,结合GPT-4.1和o3-mini模型,仅用两天就完成了需12年人类工作量的Cochrane系统评价更新。

基准测试显示,otto-SR在灵敏度(96.7% vs 81.7%)、特异度(93.9%)和数据提取准确率(93.1% vs 79.7%)上全面优于人类,同时发现54篇被遗漏的关键研究。在五项综述的评估中,otto-SR在摘要和全文筛选阶段均展现出更高的敏感性和特异性。

此外,otto-SR在七项综述的495项研究中表现出色,平均加权准确率达93.1%,远超双人评审员(79.7%)和商业工具Elicit(74.8%)。盲法评审进一步确认otto-SR的卓越性能。

针对Cochrane数据库的12篇综述复现表明,otto-SR不仅大幅缩短工作时间至48小时,还使符合条件的研究数量翻倍,新增64项研究。这项技术有望加速新疗法和公共卫生应对的速度,尤其惠及资源有限的地区。正如作者所言:“黄金标准已不再属于人类。”

原文链接
本文链接:https://kx.umi6.com/article/20325.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
数字员工崛起:你的未来同事,可能是AI
2025-10-15 16:39:25
亚马逊力推 AI 遭超千名员工联署反对:越帮越忙,还带来更多工作量
2025-11-28 22:50:23
消息称阿里秘密启动“千问”项目,全面对标 ChatGPT
2025-11-13 15:05:16
漫剧启示录:互联网最差的生意,可能是AI最好的生意
2025-11-25 09:43:38
OpenAI 奥尔特曼:当前可能会被 AI 消灭的岗位也许并不算“真正的工作”
2025-10-13 09:55:16
美国科技股遭猛烈抛售!小摩大喊抄底 并点名这些AI“便宜货”
2025-11-23 12:04:02
无视GDP:AI的任性崛起
2025-10-03 21:46:48
Meta 深化与 Arm 战略合作,AI 排名和推荐系统将使用 Neoverse IP 芯片
2025-10-16 09:49:47
高盛:2026年别只盯着AI 更看好医疗保健和海外股票
2025-11-27 14:41:21
周鸿祎称不用AI的员工有理由裁掉 “对不起 不是我裁掉你 是AI时代裁掉你”
2025-09-24 12:38:45
全球富豪榜映射AI变迁?甲骨文埃里森身家暴跌 谷歌两元老跻身前五
2025-11-22 10:12:03
折磨人类的验证码 已经拦不住人机了
2025-10-06 00:27:48
张朝阳:AI是学习辅助者 但人不能放弃独立思考
2025-11-10 09:06:13
24小时热文
更多
扫一扫体验小程序