2025年10月,上海AI Lab的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中夺得金牌,成为首个获此殊荣的开源模型。该模型在HiPhO基准测试中斩获12金1银,超越GPT-5和Grok-4等闭源模型,与谷歌Gemini-2.5-Pro并列第一。团队开发的协同进化多智能体系统PhysicsMinions进一步提升了复杂物理推理能力,使P1-235B-A22B综合得分达38.4分,位居全球第一。研究还构建了覆盖2024-2025年13场顶级赛事的HiPhO基准测试,并采用多阶段强化学习训练模型。这一成果标志着开源模型在物理推理领域达到新高度,展现了应对现实复杂问题的潜力。
原文链接
本文链接:https://kx.umi6.com/article/27279.html
转载请注明文章出处
相关推荐
换一换
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
下载超 10 亿、衍生模型破 20 万,阿里千问刷新全球开源模型纪录
2026-01-21 16:18:32
独家|智谱发布新一代旗舰模型GLM-5
2026-02-11 21:45:27
全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币
2025-10-28 10:42:58
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
2025-07-29 15:31:43
最强开源大模型除夕登场!397B参数千问3.5超越Gemini 3,百万Tokens低至8毛
2026-02-16 19:34:51
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
字节突然开源Seed-OSS,512K上下文主流4倍长度,推理能力刷纪录
2025-08-21 14:33:12
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
747 文章
656039 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13