1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o

Qwen2.5-Coder-32B正式发布,拿下多个主流基准测试SOTA,成为全球最强开源编程模型。在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决,斩获9胜,推翻了闭源编程模型的统治。

只需输入自然语言prompt,即可生成代码。即使是编程新手也能轻松上手。例如,用一句大白话生成计算器,不到20秒生成音乐播放器,以及制作简历。

Qwen2.5-Coder共开源0.5B/1.5B/3B/7B/14B/32B六个尺寸的全系列模型,大部分版本采用Apache 2.0许可。Qwen2.5-Coder基于Qwen2.5基础大模型进行初始化,使用5.5T tokens的数据训练,提升了代码生成、修复、推理等核心任务的性能。

Qwen2.5-Coder-32B-Instruct是旗舰模型,在代码生成、修复、推理、多编程语言支持和人类偏好对齐五个方面均超越GPT-4o。Qwen2.5-Coder支持92种编程语言,在多语言代码生成和修复上表现突出。

实际应用中,Qwen2.5-Coder打造的智能代码助手在多个基准上取得SOTA,能够快速生成小程序或游戏,如2048小游戏和图文并茂的英语单词卡页面。

Qwen2.5-Coder-32B的推出受到全球开发者追捧,此前基于Qwen2.5-Coder-1.5B和7B版本已打造多个热门应用。Qwen系列代表了开源模型的最高水平,不断缩小与闭源模型的差距,为中国创新力量在全球大模型竞技中争得一席之地。

GitHub地址:https://github.com/QwenLM/Qwen2.5-Coder
技术报告:https://arxiv.org/abs/2409.12186

号外:通义千问Qwen联合魔搭社区、阿里云开发者社区发起征文活动,围绕Agent应用、微调/部署、行业应用、Qwen-coder应用创作技术实践文章,瓜分10万元奖金!

原文链接
本文链接:https://kx.umi6.com/article/8599.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
2025-02-08 19:30:12
OpenAI CEO山姆·奥特曼:DeepSeek并未影响GPT的增长 将推更好的开源模型
2025-04-14 13:33:39
阿里通义千问推出 Qwen2-VL:开源 2B / 7B 模型,处理任意分辨率图像无需分割成块
2024-08-30 10:12:38
24小时热文
更多
扫一扫体验小程序