CL-bench - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

首席科学家姚顺雨腾讯首篇论文：道破为何AI死活听不懂人话

2026年2月4日，腾讯混元团队与复旦联合发布论文《CL-bench》，这是腾讯首席AI科学家姚顺雨入职后的首篇署名研究。论文指出，当前AI与真正智能的差距在于学习能力，而非知识量。研究团队构建了CL-bench基准，专门评测语言模型从上下文中学习新知识并应用的能力。该基准包含500个复杂上下文、1899个任务和31607个验证标准，要求模型解决预训练中未见过的问题。实验显示，全球前十语言模型在CL-bench上的任务解决率仅17.2%，表明现有模型在上下文利用方面仍存在显著短板。这一研究为大语言模型的迭代指明方向，即强化从上下文中学习的能力。

原文链接