超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
11月12日,阿里云通义大模型团队开源了通义千问代码模型全系列,共6款Qwen2.5-Coder模型。相关评测显示,这6款代码模型在同等尺寸下均取得了业界最佳效果。特别是32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,同时在多项关键能力上超越闭源模型GPT-4o。Qwen2.5-Coder使AI编程性能和效率大幅提升,即使是编程“小白”也能轻松生成网站、数据图表、简历和游戏等应用。
编程语言高度逻辑化且结构化,对代码模型的要求极高。Qwen2.5-Coder基于Qwen2.5基础大模型初始化,通过5.5T tokens的数据训练,显著提升了代码生成、推理和修复等核心任务的能力。旗舰模型Qwen2.5-Coder-32B-Instruct在多个主流代码生成基准上刷新了开源模型的得分记录,并在代码修复和多编程语言能力上优于GPT-4o。
在代码推理方面,Qwen2.5-Coder-32B-Instruct刷新了CRUXEval-O基准开源模型的最佳纪录。它在40余种编程语言中表现出色,在McEval基准上取得所有开闭源模型的最高分,并在MdEval基准上获得开源冠军。
此次开源,Qwen2.5-Coder提供了0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型,包括Base和Instruct两种类型。Base模型供开发者微调,Instruct模型则为开箱即用的官方对齐模型。所有Qwen2.5-Coder模型在同等尺寸下均达到最佳性能。
Qwen2.5-Coder全系列开源,适用于多种应用场景,无论是端侧还是云上,都能让AI大模型更好地协助开发者完成编程开发。内置Qwen2.5-Coder的代码助手和可视化工具,使用户可以通过自然语言对话生成各种应用。
截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎每个模型都达到了同等尺寸下的最佳性能。据统计,全球基于Qwen系列二次开发的衍生模型数量已达7.43万,超过Llama系列的7.28万,通义千问成为全球最大的生成式语言模型族群。
(完)
.png)

-
2025-07-21 11:21:54
-
2025-07-21 11:20:45
-
2025-07-21 11:19:36