7月24日,苹果公司与剑桥大学合作发布一项新研究,提出一种改进AI评审质量的系统。该系统通过引入外部验证工具,提升AI在复杂任务(如长篇事实核查、高级编码和数学问题)中的评估能力。研究人员设计了一个自主评估代理,可判断是否需使用工具,并完成初始评估、工具调用和最终决策三步流程。这些工具包括网络搜索的事实核查、代码执行验证以及数学运算检查。若无需工具,则使用基线大语言模型注释器处理简单任务。此方法旨在克服人类评审的时间限制、疲劳及偏见,同时解决AI在复杂任务上的局限性。
原文链接
本文链接:https://kx.umi6.com/article/22278.html
转载请注明文章出处
相关推荐
换一换
苹果公司CEO库克现身苏河湾大会:更担心人像电脑那样思考
2025-10-18 13:38:41
苹果公司展示AI伴侣台灯:可可爱爱随音乐起舞 还能批改作业
2025-02-07 21:10:15
苹果公司计划在2025年年中之前将AI功能引入到中国的iPhone 最早将在5月推出
2025-02-14 11:35:19
剑桥大学等机构调查显示:1/6 英国成年人认为减少作业是学校应对学生滥用 AI 的良方
2025-07-29 00:21:22
Alphabet公司CEO:将基于Gemini技术与苹果公司联合开发下一代苹果基础模型
2026-02-05 16:02:47
三星电机向苹果公司提供半导体玻璃基板样品
2026-04-07 20:18:36
谷歌反垄断判决危及苹果200亿+美元营收 意外凸显AI含金量
2024-08-06 21:55:43
苹果公司计划让用户在iOS 27系统中自行选择使用竞争对手的人工智能模型
2026-05-06 01:52:31
DeepSeek,能否“拯救”苹果?
2025-01-31 11:50:11
苹果公司CEO库克:Apple Intelligence正在努力进入中国市场
2025-10-18 11:31:28
分析师罕见降低苹果评级至卖出!iPhone需求疲软、AI变现能力不明
2025-01-21 16:40:27
大摩:预计苹果公司机器人业务收入到2040年将达1300亿美元 相当于苹果当前营收的30%
2025-11-07 11:52:36
小米OV和荣耀,新战事将从九月燃起
2024-08-26 09:30:58
726 文章
662700 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41