最强数学大模型易主,阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型,展现出了卓越的数学能力。特别是在竞赛级试题的解答上,Qwen2-Math的表现尤为突出,其在AIME 24的30道题中正确解答了11道,远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本,其中72B版本在MATH数据集上的表现显著优于GPT-4o,提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破,赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力,更在于其开源特性,使得更多开发者能够利用这一模型进行创新。对于72B版本,如果月活跃用户超过1亿,则需向千问团队申请商业使用许可。 此消息在AI社区引发轰动,表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出,Qwen2-Math有望进一步拓展其应用范围,为全球数学教育和研究提供强大支持。
原文链接
本文链接:https://kx.umi6.com/article/4814.html
转载请注明文章出处
相关推荐
换一换
GPT-5刚出,人们为什么又怀念GPT-4o
2025-08-11 08:57:55
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
GPT-4o一夜被赶超,Anthropic推出Claude 3.5,网友3分钟克隆马里奥游戏
2024-06-21 22:05:07
超越 GPT-4o:开源科研模型 OpenScholar 登场,4500 万篇论文检索增强生成回答
2024-11-26 19:38:14
百川智能发布全链路领域增强金融大模型 Baichuan4-Finance,测试成绩领先 GPT-4o
2024-12-23 11:53:01
GPT-4o过于谄媚,“赛博舔狗”惹争议
2025-05-01 16:32:29
GPT-4o的P图太火了,GPU在融化,官方终于限流了
2025-03-28 21:07:22
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
2024-12-30 15:18:52
Llama 3.1磁力链提前泄露,开源模型王座一夜易主,GPT-4o被超越
2024-07-23 12:59:35
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
2025-02-17 12:49:05
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
2025-08-01 19:06:23
今日起,Mac版ChatGPT应用人人可下,GPT-4o语音功能却再鸽一个月
2024-06-26 16:52:21
641 文章
415989 浏览
24小时热文
更多
-
2026-01-23 10:51:27 -
2026-01-23 10:50:21 -
2026-01-23 10:49:16