超越GPT-4o！阿里云开源最强代码模型Qwen2.5-Coder

11月12日，阿里云通义大模型团队开源了通义千问代码模型全系列，共6款Qwen2.5-Coder模型。相关评测显示，这6款代码模型在同等尺寸下均取得了业界最佳效果。特别是32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩，成为全球最强开源代码模型，同时在多项关键能力上超越闭源模型GPT-4o。Qwen2.5-Coder使AI编程性能和效率大幅提升，即使是编程“小白”也能轻松生成网站、数据图表、简历和游戏等应用。

编程语言高度逻辑化且结构化，对代码模型的要求极高。Qwen2.5-Coder基于Qwen2.5基础大模型初始化，通过5.5T tokens的数据训练，显著提升了代码生成、推理和修复等核心任务的能力。旗舰模型Qwen2.5-Coder-32B-Instruct在多个主流代码生成基准上刷新了开源模型的得分记录，并在代码修复和多编程语言能力上优于GPT-4o。

在代码推理方面，Qwen2.5-Coder-32B-Instruct刷新了CRUXEval-O基准开源模型的最佳纪录。它在40余种编程语言中表现出色，在McEval基准上取得所有开闭源模型的最高分，并在MdEval基准上获得开源冠军。

此次开源，Qwen2.5-Coder提供了0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型，包括Base和Instruct两种类型。Base模型供开发者微调，Instruct模型则为开箱即用的官方对齐模型。所有Qwen2.5-Coder模型在同等尺寸下均达到最佳性能。

Qwen2.5-Coder全系列开源，适用于多种应用场景，无论是端侧还是云上，都能让AI大模型更好地协助开发者完成编程开发。内置Qwen2.5-Coder的代码助手和可视化工具，使用户可以通过自然语言对话生成各种应用。

截至目前，Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型，几乎每个模型都达到了同等尺寸下的最佳性能。据统计，全球基于Qwen系列二次开发的衍生模型数量已达7.43万，超过Llama系列的7.28万，通义千问成为全球最大的生成式语言模型族群。

（完）

原文链接

本文链接：https://kx.umi6.com/article/8668.html

转载请注明文章出处

Qwen2.5-Coder