1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

最强数学大模型易主,阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型,展现出了卓越的数学能力。特别是在竞赛级试题的解答上,Qwen2-Math的表现尤为突出,其在AIME 24的30道题中正确解答了11道,远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本,其中72B版本在MATH数据集上的表现显著优于GPT-4o,提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破,赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力,更在于其开源特性,使得更多开发者能够利用这一模型进行创新。对于72B版本,如果月活跃用户超过1亿,则需向千问团队申请商业使用许可。 此消息在AI社区引发轰动,表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出,Qwen2-Math有望进一步拓展其应用范围,为全球数学教育和研究提供强大支持。

原文链接
本文链接:https://kx.umi6.com/article/4814.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
菲尔兹奖得主亲测 GPT-4o,经典过河难题破解失败
2024-06-30 15:55:25
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
解锁 GPT-4o,“上帝”版 ChatGPT 绕过 OpenAI 防护栏:能回答制作汽油弹等问题
2024-06-01 11:27:13
大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑
2024-12-01 20:40:53
GPT-4o前研发负责人辞职创业
2024-09-11 12:25:26
专家也不如AI了:GPT-4o道德推理能力已比专家更强
2024-06-24 12:53:22
OpenAI 放开成人内容?
2025-02-19 13:49:01
奥尔特曼:OpenAI 正逐步撤回 GPT-4o“过于奉承”的更新
2025-04-30 19:31:59
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
2025-08-01 19:06:23
全球首款集成GPT-4o的智能眼镜,会成为爆款吗?
2024-07-03 08:19:05
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
2024-10-21 13:29:28
GPT-4o偷偷升级,变身聊天鬼才!新版STEM智力飙升,生图却惨遭削弱?
2025-05-05 09:41:32
24小时热文
更多
扫一扫体验小程序