1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o

Qwen2.5-Coder-32B正式发布,拿下多个主流基准测试SOTA,成为全球最强开源编程模型。在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决,斩获9胜,推翻了闭源编程模型的统治。

只需输入自然语言prompt,即可生成代码。即使是编程新手也能轻松上手。例如,用一句大白话生成计算器,不到20秒生成音乐播放器,以及制作简历。

Qwen2.5-Coder共开源0.5B/1.5B/3B/7B/14B/32B六个尺寸的全系列模型,大部分版本采用Apache 2.0许可。Qwen2.5-Coder基于Qwen2.5基础大模型进行初始化,使用5.5T tokens的数据训练,提升了代码生成、修复、推理等核心任务的性能。

Qwen2.5-Coder-32B-Instruct是旗舰模型,在代码生成、修复、推理、多编程语言支持和人类偏好对齐五个方面均超越GPT-4o。Qwen2.5-Coder支持92种编程语言,在多语言代码生成和修复上表现突出。

实际应用中,Qwen2.5-Coder打造的智能代码助手在多个基准上取得SOTA,能够快速生成小程序或游戏,如2048小游戏和图文并茂的英语单词卡页面。

Qwen2.5-Coder-32B的推出受到全球开发者追捧,此前基于Qwen2.5-Coder-1.5B和7B版本已打造多个热门应用。Qwen系列代表了开源模型的最高水平,不断缩小与闭源模型的差距,为中国创新力量在全球大模型竞技中争得一席之地。

GitHub地址:https://github.com/QwenLM/Qwen2.5-Coder
技术报告:https://arxiv.org/abs/2409.12186

号外:通义千问Qwen联合魔搭社区、阿里云开发者社区发起征文活动,围绕Agent应用、微调/部署、行业应用、Qwen-coder应用创作技术实践文章,瓜分10万元奖金!

原文链接
本文链接:https://kx.umi6.com/article/8599.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
DeepSeek,搅了谁的局?
2025-02-11 10:42:38
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
开源模型三城记
2025-07-30 10:43:17
Meta发布最强开源Llama 4,超越DeepSeek V3
2025-04-06 10:58:02
威胁还是机遇?DeepSeek的崛起对全球AI芯片行业影响几何
2025-02-07 18:06:02
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了
2025-04-08 15:58:38
24小时热文
更多
扫一扫体验小程序