1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:ICLR 2025:顶尖科学家热议AI趋势

自GPT-4发布以来,大语言模型的研究热度不减,技术进步不断涌现。Anthropic于2024年11月发布的MCP成为AI生态的重要桥梁,而GPT-4o和GPT-4.1的相继推出,则将上下文处理能力提升了八倍。在国内,DeepSeek凭借FP8混合精度训练引起轰动,Manus发布的通用Agent也引发了广泛关注。

2025年4月26日,雷峰网和AI科技评论举办了以“顶尖科学家聊2025 ICLR最新趋势”为主题的线上圆桌沙龙,邀请南洋理工大学安波教授、浙江大学赵俊博研究员、清华大学赵昊助理教授以及埃默里大学刘菲副教授共同探讨AI行业的最新动向。

嘉宾们围绕LLM决策系统、Agent前沿趋势、Scaling Law前景及新模型架构等话题发表了见解。赵俊博指出,高质量数据的耗竭已成为事实,预训练数据的上限约为25~30TB,可能成为LLM的天花板。刘菲强调,需重新思考数据在预训练和后训练中的合理分配,以最大化模型能力。此外,她提出通过任务创新提升模型特定领域的表现。

Scaling Law是否已到尽头?赵俊博认为需分领域看待,高质量数据的枯竭不可避免,而Post-training方面仍有发展空间。安波则表示,学术界不应过度纠结于Scaling Law的尽头,更重要的是持续创新。

关于模型架构,赵俊博看好Diffusion模型的潜力,认为其在多模态任务上的表现优于自回归模型。刘菲也认同这一观点,但强调Transformer仍是自然语言处理的主流。赵昊则提出,未来多模态大模型需解决视觉与语言的结合难题。

在Agent领域,赵昊提议结合区块链技术构建可信的加密协同框架。刘菲展示了HARBOR和PlanGenLLMs两个项目,前者聚焦个性化Agent,后者致力于统一评估方法。安波指出,强化学习是实现复杂决策的关键,而动态协作优化是多Agent系统的核心挑战。

关于未来,赵昊认为生成更可控的内容将是提升机器人智力的重要途径,但灵敏性仍是瓶颈。刘菲强调基础模型的重要性,并呼吁加强模型安全性研究。安波则关注决策系统的鲁棒性,认为与环境的真实交互至关重要。

这场圆桌讨论展示了AI领域的最新趋势和挑战,也为未来的研究方向提供了诸多启发。

原文链接
本文链接:https://kx.umi6.com/article/17908.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
「阶跃星辰」的一次豪赌
2025-05-21 08:55:53
推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
2025-03-31 15:35:17
现在的大模型现状,就是豪赌
2025-01-24 08:35:12
爆火了大半年,Agent到底能干好多少活
2025-07-29 15:34:30
AI四小强重新上桌了?
2025-07-26 20:47:21
大模型公司不搞浏览器搞Agent,实测找到原因了
2025-10-31 17:41:56
阿里 Qwen 技术负责人林俊旸:模型即产品,做模型就是在做产品
2026-01-12 09:26:44
对话OpenManus团队:他们是如何3小时复刻Manus的
2025-03-09 12:40:06
DeepSeek之后,每一家公司都是Agent
2025-04-02 21:46:19
苹果发现模型蒸馏Scaling Law!教师模型并非越强越好
2025-02-14 16:41:33
回望大模型这一年:混搭、扩散、ROI
2025-01-21 17:44:03
ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
2025-04-28 11:48:41
Agent+数据,会成为企业的新决策大脑吗?|直播预告
2025-06-25 19:32:39
24小时热文
更多
扫一扫体验小程序