阿里旗下通义千问Qwen3深夜开源,2小时内GitHub收获17k星,登顶全球开源模型榜首。Qwen3采用MoE架构,参数235B,激活仅需22B,支持混合推理模式,涵盖8款模型,从小至0.6B到大至235B,适配多种应用场景。其性能远超DeepSeek-R1、OpenAI-o1等顶级模型,尤其在数学、代码生成和多语言支持方面表现突出,参数量仅为DeepSeek-R1的1/3,但成本更低。Qwen3支持119种语言,可无缝切换思考与非思考模式,大幅降低推理成本。此外,其预训练数据达36万亿token,后训练强化学习优化显著提升了指令遵循与智能体能力。Qwen3已在魔搭、Hugging Face、GitHub等平台开源,支持免费商用。
原文链接
本文链接:https://kx.umi6.com/article/18141.html
转载请注明文章出处
相关推荐
换一换
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
闭源主力选手拥抱开源?OpenAI 被曝最快下周推开源 AI 模型,o3 mini 级推理能力
2025-07-10 11:22:08
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025-09-01 16:20:02
AI生图新的王者诞生了!腾讯混元图像3.0登顶榜一
2025-10-05 17:24:12
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
2025-05-09 16:51:28
匆匆发布的Llama4
2025-04-06 16:09:03
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
2025-09-10 19:40:11
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
智谱发布新一代开源模型 极速版最高达到200tokens/秒
2025-04-15 08:25:16
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
555 文章
260229 浏览
24小时热文
更多
-
2025-10-28 13:51:08 -
2025-10-28 12:53:05 -
2025-10-28 12:52:57