最强数学大模型易主,阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型,展现出了卓越的数学能力。特别是在竞赛级试题的解答上,Qwen2-Math的表现尤为突出,其在AIME 24的30道题中正确解答了11道,远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本,其中72B版本在MATH数据集上的表现显著优于GPT-4o,提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破,赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力,更在于其开源特性,使得更多开发者能够利用这一模型进行创新。对于72B版本,如果月活跃用户超过1亿,则需向千问团队申请商业使用许可。 此消息在AI社区引发轰动,表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出,Qwen2-Math有望进一步拓展其应用范围,为全球数学教育和研究提供强大支持。
原文链接
本文链接:https://kx.umi6.com/article/4814.html
转载请注明文章出处
相关推荐
换一换
ChatGPT 负责人复盘 GPT-4o 下架风波:过早下架属失误,后续将迭代模型人格
2025-09-18 14:53:31
OpenAI 拓展医疗保健领域,GPT-4o 模型打造 AI 工具:辅助筛查 / 治疗癌症
2024-06-19 09:34:42
GPT-4o掀起“吉卜力风”,连CEO奥特曼也换了头像!版权争议虽迟但到
2025-03-28 17:54:27
一手体验:最新发布的GPT-4o多模态生图,就是当今的王
2025-03-26 18:05:08
GPT-4o前研发负责人辞职创业
2024-09-11 12:25:26
全球网友喊话山姆·奥特曼: 还我GPT-4o
2025-08-13 15:40:26
对标GPT-4o的谷歌Gemini Live,翻车了?
2024-08-15 23:06:49
吉卜力风格 AI 图刷屏之际,消息称 OpenAI 正测试 GPT-4o 生图模型水印
2025-04-07 08:45:55
阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o
2024-11-12 17:09:55
GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了
2025-03-27 22:09:31
微调 GPT-4o AI 模型新维度,OpenAI 开放图片视觉微调功能
2024-10-09 09:50:54
OpenAI 宣布升级 GPT-4o 并面向所有付费用户开放,免费用户仍需等待数周
2025-03-28 08:32:24
GPT-5刚出,人们为什么又怀念GPT-4o
2025-08-11 08:57:55
696 文章
536621 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26