1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:AI两天完成人类12年文献综述工作,准确率高出近15%

正文:

当人类科研人员还在翻阅上百个浏览器窗口时,AI已经大幅提升了文献综述的效率。医学领域中,传统的系统评价(SRs)平均耗时超16个月,成本高昂,且易导致无效或有害治疗的延续。多伦多大学和哈佛医学院等机构合作开发的AI端到端工作流程“otto-SR”,结合GPT-4.1和o3-mini模型,仅用两天就完成了需12年人类工作量的Cochrane系统评价更新。

基准测试显示,otto-SR在灵敏度(96.7% vs 81.7%)、特异度(93.9%)和数据提取准确率(93.1% vs 79.7%)上全面优于人类,同时发现54篇被遗漏的关键研究。在五项综述的评估中,otto-SR在摘要和全文筛选阶段均展现出更高的敏感性和特异性。

此外,otto-SR在七项综述的495项研究中表现出色,平均加权准确率达93.1%,远超双人评审员(79.7%)和商业工具Elicit(74.8%)。盲法评审进一步确认otto-SR的卓越性能。

针对Cochrane数据库的12篇综述复现表明,otto-SR不仅大幅缩短工作时间至48小时,还使符合条件的研究数量翻倍,新增64项研究。这项技术有望加速新疗法和公共卫生应对的速度,尤其惠及资源有限的地区。正如作者所言:“黄金标准已不再属于人类。”

原文链接
本文链接:https://kx.umi6.com/article/20325.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI的「梦醒时分」
2025-12-09 15:41:20
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
一道50米洗车题让全网AI翻车!实测:豆包元宝等国产大模型都懵逼了 仅Gemini秒懂
2026-02-11 17:35:22
黄仁勋:AI将使全球GDP增长5倍 每个国家都需要打造它
2025-12-12 12:48:25
AI 正降低创业门槛,15 岁高中生独立创办科技公司
2025-12-22 15:48:24
Runway 发布 GWM-1 世界模型:未来电影有望靠 AI“算”出来
2025-12-12 15:56:34
Anthropic 及谷歌 DeepMind CEO:AI 已开始取代公司内部的初级职位
2026-01-21 09:02:38
离家50米远 是走着去还是开车去?洗车问题难倒一众AI
2026-02-11 09:09:15
输入法「变笨了」吗?
2026-01-13 11:37:39
AI做日本高考题9科得满分
2026-01-20 22:34:54
美国AI被电力卡脖子:进口依赖度高达80% 恰好是中国强项
2026-03-04 20:08:50
AI“手指难题”翻车,6 根手指暴露 Transformer 致命缺陷
2025-12-15 22:02:22
黄仁勋驳斥AI取代软件论 称其“不合逻辑”
2026-02-04 17:59:05
24小时热文
更多
扫一扫体验小程序