2026年2月4日,腾讯混元团队与复旦联合发布论文《CL-bench》,这是腾讯首席AI科学家姚顺雨入职后的首篇署名研究。论文指出,当前AI与真正智能的差距在于学习能力,而非知识量。研究团队构建了CL-bench基准,专门评测语言模型从上下文中学习新知识并应用的能力。该基准包含500个复杂上下文、1899个任务和31607个验证标准,要求模型解决预训练中未见过的问题。实验显示,全球前十语言模型在CL-bench上的任务解决率仅17.2%,表明现有模型在上下文利用方面仍存在显著短板。这一研究为大语言模型的迭代指明方向,即强化从上下文中学习的能力。
原文链接
本文链接:https://kx.umi6.com/article/32597.html
转载请注明文章出处
相关推荐
换一换
OpenAI喜提姚班学霸姚顺雨
2024-08-02 15:14:16
姚顺雨现身清华闭门论坛:模型相关生产力提升或商业化才刚刚开始
2026-01-10 17:27:50
入职腾讯后姚顺雨首度公开发声:AI应用分化明显 Claude Code正重塑计算机行业
2026-01-12 09:30:07
在腾讯偶遇姚顺雨,这一次他是来发科研奖金的…
2026-01-31 20:57:55
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
姚顺雨离职OpenAI,开启下半场
2025-09-12 10:10:09
OpenAI喜提姚班学霸姚顺雨:思维树作者,普林斯顿博士,还是个Rapper
2024-08-02 14:03:39
当姚顺雨的巨脸降临中国AGI
2026-01-13 11:28:22
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
消息称腾讯大模型团队架构调整:前 OpenAI 研究员姚顺雨任要职,校招最高 2 倍薪资挖 AI 人才
2025-12-17 17:57:42
首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
2026-02-04 17:57:59
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队:研究不微调只靠提示词能走多远
2024-06-03 18:57:18
744 文章
483854 浏览
24小时热文
更多
-
2026-02-04 22:10:24 -
2026-02-04 22:09:50 -
2026-02-04 22:09:20