2025年10月,上海AI Lab的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中夺得金牌,成为首个获此殊荣的开源模型。该模型在HiPhO基准测试中斩获12金1银,超越GPT-5和Grok-4等闭源模型,与谷歌Gemini-2.5-Pro并列第一。团队开发的协同进化多智能体系统PhysicsMinions进一步提升了复杂物理推理能力,使P1-235B-A22B综合得分达38.4分,位居全球第一。研究还构建了覆盖2024-2025年13场顶级赛事的HiPhO基准测试,并采用多阶段强化学习训练模型。这一成果标志着开源模型在物理推理领域达到新高度,展现了应对现实复杂问题的潜力。
原文链接
本文链接:https://kx.umi6.com/article/27279.html
转载请注明文章出处
相关推荐
换一换
AI出海,掘金一个时代
2026-02-07 10:06:40
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
商汤开源 SenseNova-MARS,突破多模态搜索推理天花板
2026-01-30 18:41:28
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
阿里开源4款Qwen3.5小尺寸模型,马斯克点赞:惊人的智能水平
2026-03-03 11:53:36
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开
2025-10-16 17:57:55
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
2026-01-12 16:41:44
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
2025-09-08 13:58:15
中国在开源 AI 模型市场首超美国,与 OpenAI 之“封闭”形成鲜明对比
2025-11-26 12:43:57
小米具身大模型 MiMo-Embodied 发布并全面开源,业界首个打通自动驾驶与具身智能
2025-11-21 18:38:45
721 文章
562464 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33