阿里旗下通义千问Qwen3深夜开源,2小时内GitHub收获17k星,登顶全球开源模型榜首。Qwen3采用MoE架构,参数235B,激活仅需22B,支持混合推理模式,涵盖8款模型,从小至0.6B到大至235B,适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型,尤其在数学、代码生成和多语言支持方面表现突出,参数量仅为DeepSeek-R1的1/3,但成本更低。Qwen3支持119种语言,可无缝切换思考与非思考模式,大幅降低推理成本。此外,其预训练数据达36万亿token,后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源,支持免费商用。
原文链接
本文链接:https://kx.umi6.com/article/18141.html
转载请注明文章出处
相关推荐
.png)
换一换
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型 已上架超4万个开源模型
2025-02-21 13:58:38
首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
2025-05-09 16:51:28
开源AI新王被指造假,不要迷信大模型的榜单了
2024-09-11 20:33:28
450 文章
62462 浏览
24小时热文
更多

-
2025-07-20 12:02:31
-
2025-07-20 10:03:13
-
2025-07-20 10:02:01