综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月4日,腾讯混元团队与复旦联合发布论文《CL-bench》,这是腾讯首席AI科学家姚顺雨入职后的首篇署名研究。论文指出,当前AI与真正智能的差距在于学习能力,而非知识量。研究团队构建了CL-bench基准,专门评测语言模型从上下文中学习新知识并应用的能力。该基准包含500个复杂上下文、1899个任务和31607个验证标准,要求模型解决预训练中未见过的问题。实验显示,全球前十语言模型在CL-bench上的任务解决率仅17.2%,表明现有模型在上下文利用方面仍存在显著短板。这一研究为大语言模型的迭代指明方向,即强化从上下文中学习的能力。
原文链接
加载更多
暂无内容