深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

2025-05-05 09:42:37

智能视野

发布在

快讯

阅读：1050

阿里旗下通义千问Qwen3深夜开源，2小时内GitHub收获17k星，登顶全球开源模型榜首。Qwen3采用MoE架构，参数235B，激活仅需22B，支持混合推理模式，涵盖8款模型，从小至0.6B到大至235B，适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型，尤其在数学、代码生成和多语言支持方面表现突出，参数量仅为DeepSeek-R1的1/3，但成本更低。Qwen3支持119种语言，可无缝切换思考与非思考模式，大幅降低推理成本。此外，其预训练数据达36万亿token，后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源，支持免费商用。

原文链接

本文链接：https://kx.umi6.com/article/18141.html

转载请注明文章出处

Qwen3