2026年2月4日,腾讯混元团队与复旦联合发布论文《CL-bench》,这是腾讯首席AI科学家姚顺雨入职后的首篇署名研究。论文指出,当前AI与真正智能的差距在于学习能力,而非知识量。研究团队构建了CL-bench基准,专门评测语言模型从上下文中学习新知识并应用的能力。该基准包含500个复杂上下文、1899个任务和31607个验证标准,要求模型解决预训练中未见过的问题。实验显示,全球前十语言模型在CL-bench上的任务解决率仅17.2%,表明现有模型在上下文利用方面仍存在显著短板。这一研究为大语言模型的迭代指明方向,即强化从上下文中学习的能力。
原文链接
本文链接:https://kx.umi6.com/article/32597.html
转载请注明文章出处
相关推荐
换一换
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
OpenAI喜提姚班学霸姚顺雨
2024-08-02 15:14:16
OpenAI喜提姚班学霸姚顺雨:思维树作者,普林斯顿博士,还是个Rapper
2024-08-02 14:03:39
当姚顺雨的巨脸降临中国AGI
2026-01-13 11:28:22
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
腾讯辟谣“前 OpenAI 姚顺雨上亿薪资入职腾讯”
2025-09-12 09:08:13
入职腾讯后姚顺雨首度公开发声:AI应用分化明显 Claude Code正重塑计算机行业
2026-01-12 09:30:07
年仅27岁出任腾讯AI首席科学家:高考数学睡觉错失全省第一
2025-12-21 10:36:26
在腾讯偶遇姚顺雨,这一次他是来发科研奖金的…
2026-01-31 20:57:55
OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队:研究不微调只靠提示词能走多远
2024-06-03 18:57:18
腾讯辟谣:OpenAI姚顺雨1亿薪资入职腾讯不实
2025-09-12 09:11:24
姚顺雨入职腾讯后首次公开发言:AI 在 To C 和 To B 领域的应用落地出现明显分化
2026-01-10 18:28:15
姚顺雨现身清华闭门论坛:模型相关生产力提升或商业化才刚刚开始
2026-01-10 17:27:50
793 文章
609550 浏览
24小时热文
更多
-
2026-04-24 18:29:17 -
2026-04-24 18:28:12 -
2026-04-24 18:27:05