最强数学大模型易主,阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型,展现出了卓越的数学能力。特别是在竞赛级试题的解答上,Qwen2-Math的表现尤为突出,其在AIME 24的30道题中正确解答了11道,远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本,其中72B版本在MATH数据集上的表现显著优于GPT-4o,提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破,赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力,更在于其开源特性,使得更多开发者能够利用这一模型进行创新。对于72B版本,如果月活跃用户超过1亿,则需向千问团队申请商业使用许可。 此消息在AI社区引发轰动,表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出,Qwen2-Math有望进一步拓展其应用范围,为全球数学教育和研究提供强大支持。
原文链接
本文链接:https://kx.umi6.com/article/4814.html
转载请注明文章出处
相关推荐
换一换
奥尔特曼:OpenAI 正逐步撤回 GPT-4o“过于奉承”的更新
2025-04-30 19:31:59
GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了
2025-03-27 22:09:31
GPT-4即将“退役”!OpenAI宣布本月末起它将被GPT-4o替代
2025-04-14 16:42:54
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT-4o
2024-07-05 21:18:05
Llama 3.1提前泄密,将GPT-4o踹下宝座?更快,价格便宜10倍
2024-07-24 09:04:52
GPT-4o更容易越狱?北航&南洋理工上万次测试给出详细分析
2024-06-12 15:09:32
GPT-4o掀起“吉卜力风”,连CEO奥特曼也换了头像!版权争议虽迟但到
2025-03-28 17:54:27
研究显示 GPT-4o 会为“自保”而避免“被关闭”,牺牲用户利益也在所不惜
2025-06-12 08:28:18
ChatGPT 负责人复盘 GPT-4o 下架风波:过早下架属失误,后续将迭代模型人格
2025-09-18 14:53:31
超越 GPT-4o:开源科研模型 OpenScholar 登场,4500 万篇论文检索增强生成回答
2024-11-26 19:38:14
OpenAI 拓展医疗保健领域,GPT-4o 模型打造 AI 工具:辅助筛查 / 治疗癌症
2024-06-19 09:34:42
研究人员绕过 GPT-4o 模型安全护栏,利用“十六进制字符串”成功令其编写漏洞攻击程序
2024-11-05 14:43:32
540 文章
256574 浏览
24小时热文
更多
-
2025-10-24 19:49:44 -
2025-10-24 18:49:31 -
2025-10-24 18:49:20