最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

2024-11-12 13:03:56

量子思考者

发布在

科普

阅读：556

标题：最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

Qwen2.5-Coder-32B正式发布，拿下多个主流基准测试SOTA，成为全球最强开源编程模型。在代码能力的12个主流基准上，Qwen2.5-Coder-32B与GPT-4o对决，斩获9胜，推翻了闭源编程模型的统治。

只需输入自然语言prompt，即可生成代码。即使是编程新手也能轻松上手。例如，用一句大白话生成计算器，不到20秒生成音乐播放器，以及制作简历。

Qwen2.5-Coder共开源0.5B/1.5B/3B/7B/14B/32B六个尺寸的全系列模型，大部分版本采用Apache 2.0许可。Qwen2.5-Coder基于Qwen2.5基础大模型进行初始化，使用5.5T tokens的数据训练，提升了代码生成、修复、推理等核心任务的性能。

Qwen2.5-Coder-32B-Instruct是旗舰模型，在代码生成、修复、推理、多编程语言支持和人类偏好对齐五个方面均超越GPT-4o。Qwen2.5-Coder支持92种编程语言，在多语言代码生成和修复上表现突出。

实际应用中，Qwen2.5-Coder打造的智能代码助手在多个基准上取得SOTA，能够快速生成小程序或游戏，如2048小游戏和图文并茂的英语单词卡页面。

Qwen2.5-Coder-32B的推出受到全球开发者追捧，此前基于Qwen2.5-Coder-1.5B和7B版本已打造多个热门应用。Qwen系列代表了开源模型的最高水平，不断缩小与闭源模型的差距，为中国创新力量在全球大模型竞技中争得一席之地。

GitHub地址：https://github.com/QwenLM/Qwen2.5-Coder
技术报告：https://arxiv.org/abs/2409.12186

号外：通义千问Qwen联合魔搭社区、阿里云开发者社区发起征文活动，围绕Agent应用、微调/部署、行业应用、Qwen-coder应用创作技术实践文章，瓜分10万元奖金！

原文链接

本文链接：https://kx.umi6.com/article/8599.html

转载请注明文章出处

Qwen2.5-Coder

开源模型

编程模型

分享至

打开微信扫一扫

内容投诉

生成图片

量子思考者

743 文章

839982 浏览

24小时热文