综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年2月4日,腾讯混元团队与复旦联合发布论文《CL-bench》,这是腾讯首席AI科学家姚顺雨入职后的首篇署名研究。论文指出,当前AI与真正智能的差距在于学习能力,而非知识量。研究团队构建了CL-bench基准,专门评测语言模型从上下文中学习新知识并应用的能力。该基准包含500个复杂上下文、1899个任务和31607个验证标准,要求模型解决预训练中未见过的问题。实验显示,全球前十语言模型在CL-bench上的任务解决率仅17.2%,表明现有模型在上下文利用方面仍存在显著短板。这一研究为大语言模型的迭代指明方向,即强化从上下文中学习的能力。
原文链接
大模型新突破!来自微软亚洲研究院(MSRA)的研究团队开发出Video In-Context Learning(Vid-ICL),一种视频上下文学习方法,使模型能模仿示例生成并精准控制真实环境交互。Vid-ICL通过示例视频指导模型在新场景中生成,如物体移动、抓取和操作,提升生成视频的多样性和与环境的交互精度。该技术不仅扩展了语言和图像的交互界面,还能结合模拟器实现与现实世界的互动,接近《铁甲钢拳》般的智能。研究已发表在arXiv:2407.0735,展示了模型在保持连贯性与语义一致性方面的优秀性能。
原文链接
瑞士洛桑联邦理工(EPFL)团队获得了OpenAI的GPT-4-Base原始版本,进行一项独特研究,探索未经过微调的大模型仅依赖提示词能否实现有效对话和指令遵循。他们挑战现有技术,如URIAL,但发现即便使用增加示例和贪心搜索,模型与指令微调模型间的差距依然明显,尤其是在多轮对话中。研究揭示了示例选择对模型的重要性,以及大语言模型可能只是模仿而非真正理解指令逻辑。结论指出,尽管尝试了多种方法,上下文学习缩小与指令微调差距仍有挑战,AI助手的听话程度短期内不易提升。
原文链接
加载更多
暂无内容