2025年10月,上海AI Lab的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中夺得金牌,成为首个获此殊荣的开源模型。该模型在HiPhO基准测试中斩获12金1银,超越GPT-5和Grok-4等闭源模型,与谷歌Gemini-2.5-Pro并列第一。团队开发的协同进化多智能体系统PhysicsMinions进一步提升了复杂物理推理能力,使P1-235B-A22B综合得分达38.4分,位居全球第一。研究还构建了覆盖2024-2025年13场顶级赛事的HiPhO基准测试,并采用多阶段强化学习训练模型。这一成果标志着开源模型在物理推理领域达到新高度,展现了应对现实复杂问题的潜力。
原文链接
本文链接:https://kx.umi6.com/article/27279.html
转载请注明文章出处
相关推荐
换一换
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
2025-11-08 15:49:04
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
2026-01-12 16:41:44
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
抢跑GPT-5,智谱开源新SOTA模型,一句话搞出能看视频、发弹幕的B站!
2025-07-29 00:21:11
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
2025-08-06 06:22:19
腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行
2025-08-04 15:58:47
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
2025-10-11 09:36:05
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
747 文章
655057 浏览
24小时热文
更多
-
2026-06-07 23:56:41 -
2026-06-07 21:50:41 -
2026-06-07 20:48:02