2025年10月,上海AI Lab的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中夺得金牌,成为首个获此殊荣的开源模型。该模型在HiPhO基准测试中斩获12金1银,超越GPT-5和Grok-4等闭源模型,与谷歌Gemini-2.5-Pro并列第一。团队开发的协同进化多智能体系统PhysicsMinions进一步提升了复杂物理推理能力,使P1-235B-A22B综合得分达38.4分,位居全球第一。研究还构建了覆盖2024-2025年13场顶级赛事的HiPhO基准测试,并采用多阶段强化学习训练模型。这一成果标志着开源模型在物理推理领域达到新高度,展现了应对现实复杂问题的潜力。
原文链接
本文链接:https://kx.umi6.com/article/27279.html
转载请注明文章出处
相关推荐
换一换
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
2025-08-11 16:03:42
开源新标杆!商汤 SenseNova-MARS超 Gemini-3-Pro,模型代码数据全开放
2026-01-30 11:22:29
腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行
2025-08-04 15:58:47
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
中国AI开源模型下载量占比首次超过美国
2025-11-27 18:49:55
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
开源模型三城记
2025-07-30 10:43:17
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
2025-09-08 13:58:15
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
2025-09-10 19:40:11
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
693 文章
483310 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18