1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder

11月12日,阿里云通义大模型团队开源了通义千问代码模型全系列,共6款Qwen2.5-Coder模型。相关评测显示,这6款代码模型在同等尺寸下均取得了业界最佳效果。特别是32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,同时在多项关键能力上超越闭源模型GPT-4o。Qwen2.5-Coder使AI编程性能和效率大幅提升,即使是编程“小白”也能轻松生成网站、数据图表、简历和游戏等应用。

编程语言高度逻辑化且结构化,对代码模型的要求极高。Qwen2.5-Coder基于Qwen2.5基础大模型初始化,通过5.5T tokens的数据训练,显著提升了代码生成、推理和修复等核心任务的能力。旗舰模型Qwen2.5-Coder-32B-Instruct在多个主流代码生成基准上刷新了开源模型的得分记录,并在代码修复和多编程语言能力上优于GPT-4o。

在代码推理方面,Qwen2.5-Coder-32B-Instruct刷新了CRUXEval-O基准开源模型的最佳纪录。它在40余种编程语言中表现出色,在McEval基准上取得所有开闭源模型的最高分,并在MdEval基准上获得开源冠军。

此次开源,Qwen2.5-Coder提供了0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型,包括Base和Instruct两种类型。Base模型供开发者微调,Instruct模型则为开箱即用的官方对齐模型。所有Qwen2.5-Coder模型在同等尺寸下均达到最佳性能。

Qwen2.5-Coder全系列开源,适用于多种应用场景,无论是端侧还是云上,都能让AI大模型更好地协助开发者完成编程开发。内置Qwen2.5-Coder的代码助手和可视化工具,使用户可以通过自然语言对话生成各种应用。

截至目前,Qwen2.5已开源100多个大语言模型、多模态模型、数学模型和代码模型,几乎每个模型都达到了同等尺寸下的最佳性能。据统计,全球基于Qwen系列二次开发的衍生模型数量已达7.43万,超过Llama系列的7.28万,通义千问成为全球最大的生成式语言模型族群。

(完)

原文链接
本文链接:https://kx.umi6.com/article/8668.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
Claude Sonnet4.5来了,Anthropic说自己工程师已不写代码了,这次我信了
2025-09-30 11:26:54
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
24小时热文
更多
扫一扫体验小程序