7月24日,苹果公司与剑桥大学合作发布一项新研究,提出一种改进AI评审质量的系统。该系统通过引入外部验证工具,提升AI在复杂任务(如长篇事实核查、高级编码和数学问题)中的评估能力。研究人员设计了一个自主评估代理,可判断是否需使用工具,并完成初始评估、工具调用和最终决策三步流程。这些工具包括网络搜索的事实核查、代码执行验证以及数学运算检查。若无需工具,则使用基线大语言模型注释器处理简单任务。此方法旨在克服人类评审的时间限制、疲劳及偏见,同时解决AI在复杂任务上的局限性。
原文链接
本文链接:https://kx.umi6.com/article/22278.html
转载请注明文章出处
相关推荐
换一换
苹果还是爱中国的
2024-10-30 22:25:40
苹果库克重申6000亿美元在美投资:将对美国制造业产生连锁效应
2025-09-16 09:11:07
三季度iPhone“翻身”收入止跌,AI加身的苹果又要冲击“天花板”了
2024-11-01 15:18:09
苹果失去乔布斯的隐患,似乎正暴露无遗
2025-07-14 20:26:51
苹果公司展示AI伴侣台灯:可可爱爱随音乐起舞 还能批改作业
2025-02-07 21:10:15
小米OV和荣耀,新战事将从九月燃起
2024-08-26 09:30:58
苹果“AI狠招”剧透来了?Siri将迎大改造,或可控制所有APP功能!
2024-05-31 11:13:24
DeepSeek,能否“拯救”苹果?
2025-01-31 11:50:11
大摩:预计苹果公司机器人业务收入到2040年将达1300亿美元 相当于苹果当前营收的30%
2025-11-07 11:52:36
苹果公司AI高管Robby Walker将离职
2025-09-13 12:25:32
谷歌反垄断判决危及苹果200亿+美元营收 意外凸显AI含金量
2024-08-06 21:55:43
古尔曼:iOS 26.4内部测试中的新版Siri表现不尽人意
2025-10-20 12:04:54
苹果公司股票评级被机构罕见下调至“卖出” iPhone 16销售不温不火引担忧
2025-01-08 13:37:58
591 文章
375382 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05