2025年10月,上海AI Lab的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中夺得金牌,成为首个获此殊荣的开源模型。该模型在HiPhO基准测试中斩获12金1银,超越GPT-5和Grok-4等闭源模型,与谷歌Gemini-2.5-Pro并列第一。团队开发的协同进化多智能体系统PhysicsMinions进一步提升了复杂物理推理能力,使P1-235B-A22B综合得分达38.4分,位居全球第一。研究还构建了覆盖2024-2025年13场顶级赛事的HiPhO基准测试,并采用多阶段强化学习训练模型。这一成果标志着开源模型在物理推理领域达到新高度,展现了应对现实复杂问题的潜力。
原文链接
本文链接:https://kx.umi6.com/article/27279.html
转载请注明文章出处
相关推荐
换一换
刚刚,OpenAI发布2款开源模型,手机笔记本也能跑,北大校友扛大旗
2025-08-06 07:23:51
全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币
2025-10-28 10:42:58
中国AI开源模型下载量占比首次超过美国
2025-11-27 18:49:55
开源模型三城记
2025-07-30 10:43:17
腾讯混元 3D 开源 + 2:瞄准游戏建模、3D 打印
2025-09-26 19:32:11
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
2026-01-12 16:41:44
可能是目前效果最好的开源生图模型,混元生图3.0来了
2025-09-30 21:34:24
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”
2025-06-11 09:03:41
666 文章
428895 浏览
24小时热文
更多
-
2026-01-18 23:48:12 -
2026-01-18 22:48:57 -
2026-01-18 22:47:49