7月24日,苹果公司与剑桥大学合作发布一项新研究,提出一种改进AI评审质量的系统。该系统通过引入外部验证工具,提升AI在复杂任务(如长篇事实核查、高级编码和数学问题)中的评估能力。研究人员设计了一个自主评估代理,可判断是否需使用工具,并完成初始评估、工具调用和最终决策三步流程。这些工具包括网络搜索的事实核查、代码执行验证以及数学运算检查。若无需工具,则使用基线大语言模型注释器处理简单任务。此方法旨在克服人类评审的时间限制、疲劳及偏见,同时解决AI在复杂任务上的局限性。
原文链接
本文链接:https://kx.umi6.com/article/22278.html
转载请注明文章出处
相关推荐
换一换
苹果库克重申6000亿美元在美投资:将对美国制造业产生连锁效应
2025-09-16 09:11:07
苹果公司CEO库克:Apple Intelligence正在努力进入中国市场
2025-10-18 11:31:28
三季度iPhone“翻身”收入止跌,AI加身的苹果又要冲击“天花板”了
2024-11-01 15:18:09
DeepSeek,能否“拯救”苹果?
2025-01-31 11:50:11
剑桥大学等机构调查显示:1/6 英国成年人认为减少作业是学校应对学生滥用 AI 的良方
2025-07-29 00:21:22
苹果失去乔布斯的隐患,似乎正暴露无遗
2025-07-14 20:26:51
分析师罕见降低苹果评级至卖出!iPhone需求疲软、AI变现能力不明
2025-01-21 16:40:27
苹果市值很快将超4万亿美元?
2024-12-24 21:45:01
苹果AI逆袭,美股狂飙无视地心引力?
2024-06-21 09:19:20
苹果公司AI高管Robby Walker将离职
2025-09-13 12:25:32
苹果公司计划在2025年年中之前将AI功能引入到中国的iPhone 最早将在5月推出
2025-02-14 11:35:19
苹果公司展示AI伴侣台灯:可可爱爱随音乐起舞 还能批改作业
2025-02-07 21:10:15
小米OV和荣耀,新战事将从九月燃起
2024-08-26 09:30:58
541 文章
280735 浏览
24小时热文
更多
-
2025-10-24 19:49:44 -
2025-10-24 18:49:31 -
2025-10-24 18:49:20