最强数学大模型易主,阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型,展现出了卓越的数学能力。特别是在竞赛级试题的解答上,Qwen2-Math的表现尤为突出,其在AIME 24的30道题中正确解答了11道,远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本,其中72B版本在MATH数据集上的表现显著优于GPT-4o,提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破,赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力,更在于其开源特性,使得更多开发者能够利用这一模型进行创新。对于72B版本,如果月活跃用户超过1亿,则需向千问团队申请商业使用许可。 此消息在AI社区引发轰动,表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出,Qwen2-Math有望进一步拓展其应用范围,为全球数学教育和研究提供强大支持。
原文链接
本文链接:https://kx.umi6.com/article/4814.html
转载请注明文章出处
相关推荐
换一换
奥尔特曼:GPT-4o文生图功能总生成量将突破10亿 大多数改变世界的公司最初都被视为“套壳”
2025-04-07 17:11:17
GPT-4o前研发负责人辞职创业
2024-09-11 12:25:26
OpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭
2025-03-26 07:39:42
ChatGPT界面大更新,开始卷应用了?这次想灭谁?
2024-10-09 10:29:16
GPT-4o成了一个荒谬的谄媚者
2025-04-30 20:04:06
奥尔特曼听劝:OpenAI 将提升订阅用户推理配额,恢复 GPT-4o 等旧模型
2025-08-11 07:56:08
首次引入GPT-4o!图像自动评估新基准来啦
2024-06-28 00:32:37
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
2024-12-30 15:18:52
OpenAI升级GPT-4o模型 提升智能和个性
2025-04-26 17:56:17
LG 预告首款家用管家机器人明年登场:集成 GPT-4o AI 模型,注重和用户情感互动
2024-12-03 16:27:11
GPT-4o攻破ARC-AGI无法被挑战的神话,71%准确率成新SOTA
2024-06-20 14:13:43
GPT-4o失控,突然呻吟尖叫发癫,引发研究人员恐慌
2024-08-09 18:50:30
谷歌 Gemini 突发试验版模型:重回竞技榜第一,新版 GPT-4o 只领先了 1 天
2024-11-22 14:05:19
600 文章
348863 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57