阿里Qwen3问鼎开源王座！8款模型全面开放，最大杯全方位超越R1

2025-04-30 18:54:08

蝶舞CyberSwirl

发布在

科普

阅读：96

阿里Qwen3问鼎开源王座！8款模型全面开放，最大杯全方位超越R1

千呼万唤，Qwen3终于来了！一口气上新8大模型，全部开源。旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini，最大杯稠密模型达32B参数量。小尺寸模型Qwen3-4B在数学、代码能力上媲美大10倍模型。

本系列包含2个MoE模型和6个稠密模型，均在Apache 2.0许可下开源。后训练模型及预训练基座模型已在Hugging Face、ModelScope和Kaggle等平台开放。推荐使用SGLang、vLLM等框架部署，或Ollama、LMStudio等本地使用。

Qwen3支持MCP，增强环境交互能力，提出思考/非思考模式切换。思考模式逐步推理，非思考模式快速响应。“7米甘蔗过2米门”问题，思考模式耗时38912个token，非思考模式仅需2秒。

Qwen3预训练数据达36万亿token，涵盖119种语言和方言。预训练分三阶段：S1阶段4K上下文长度，S2阶段增加知识密集型数据，S3阶段扩展至32K上下文长度。后训练分四阶段优化模型性能。

Qwen3 Dense基础模型整体性能媲美更大规模的Qwen2.5，MoE模型仅10%激活参数即可达到相似效果。Qwen团队希望通过开源推动研究与开发，赋能全球用户。更多详情可访问官方链接。

原文链接

本文链接：https://kx.umi6.com/article/17934.html

转载请注明文章出处

Qwen3

开源

模型

分享至

打开微信扫一扫

内容投诉

生成图片

426 文章

80174 浏览

24小时热文