1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:ICLR 2025:顶尖科学家热议AI趋势

自GPT-4发布以来,大语言模型的研究热度不减,技术进步不断涌现。Anthropic于2024年11月发布的MCP成为AI生态的重要桥梁,而GPT-4o和GPT-4.1的相继推出,则将上下文处理能力提升了八倍。在国内,DeepSeek凭借FP8混合精度训练引起轰动,Manus发布的通用Agent也引发了广泛关注。

2025年4月26日,雷峰网和AI科技评论举办了以“顶尖科学家聊2025 ICLR最新趋势”为主题的线上圆桌沙龙,邀请南洋理工大学安波教授、浙江大学赵俊博研究员、清华大学赵昊助理教授以及埃默里大学刘菲副教授共同探讨AI行业的最新动向。

嘉宾们围绕LLM决策系统、Agent前沿趋势、Scaling Law前景及新模型架构等话题发表了见解。赵俊博指出,高质量数据的耗竭已成为事实,预训练数据的上限约为25~30TB,可能成为LLM的天花板。刘菲强调,需重新思考数据在预训练和后训练中的合理分配,以最大化模型能力。此外,她提出通过任务创新提升模型特定领域的表现。

Scaling Law是否已到尽头?赵俊博认为需分领域看待,高质量数据的枯竭不可避免,而Post-training方面仍有发展空间。安波则表示,学术界不应过度纠结于Scaling Law的尽头,更重要的是持续创新。

关于模型架构,赵俊博看好Diffusion模型的潜力,认为其在多模态任务上的表现优于自回归模型。刘菲也认同这一观点,但强调Transformer仍是自然语言处理的主流。赵昊则提出,未来多模态大模型需解决视觉与语言的结合难题。

在Agent领域,赵昊提议结合区块链技术构建可信的加密协同框架。刘菲展示了HARBOR和PlanGenLLMs两个项目,前者聚焦个性化Agent,后者致力于统一评估方法。安波指出,强化学习是实现复杂决策的关键,而动态协作优化是多Agent系统的核心挑战。

关于未来,赵昊认为生成更可控的内容将是提升机器人智力的重要途径,但灵敏性仍是瓶颈。刘菲强调基础模型的重要性,并呼吁加强模型安全性研究。安波则关注决策系统的鲁棒性,认为与环境的真实交互至关重要。

这场圆桌讨论展示了AI领域的最新趋势和挑战,也为未来的研究方向提供了诸多启发。

原文链接
本文链接:https://kx.umi6.com/article/17908.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Agent 要被吃进大模型了
2025-04-23 11:55:08
对话智谱CEO张鹏:大家对大模型期待过高,Scaling Law还有很大增长空间
2024-11-29 13:53:52
回望大模型这一年:混搭、扩散、ROI
2025-01-21 17:44:03
24小时热文
更多
扫一扫体验小程序