最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”

2024-08-09 15:39:44

WisdomTrail

发布在

快讯

阅读：279

最强数学大模型易主，阿里巴巴千问团队开发的Qwen2-Math模型在多项数学测试中超越了包括GPT-4在内的多个闭源模型，展现出了卓越的数学能力。特别是在竞赛级试题的解答上，Qwen2-Math的表现尤为突出，其在AIME 24的30道题中正确解答了11道，远超其他先进模型仅能解答一二道题的成绩。 Qwen2-Math拥有72B、7B和1.5B三个参数量版本，其中72B版本在MATH数据集上的表现显著优于GPT-4o，提升了9.6%的分数。这一系列成果标志着开源模型在数学领域取得了重大突破，赢得了网友们的广泛赞誉。 Qwen2-Math的成功不仅在于其强大的数学能力，更在于其开源特性，使得更多开发者能够利用这一模型进行创新。对于72B版本，如果月活跃用户超过1亿，则需向千问团队申请商业使用许可。此消息在AI社区引发轰动，表明了中国在人工智能领域的技术进步和创新能力。随着后续中英双语版本的推出，Qwen2-Math有望进一步拓展其应用范围，为全球数学教育和研究提供强大支持。

原文链接

本文链接：https://kx.umi6.com/article/4814.html

转载请注明文章出处

GPT-4o