1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1

千呼万唤,Qwen3终于来了!一口气上新8大模型,全部开源。旗舰模型Qwen3-235B-A22B全方位超越R1、o1、o3-mini,最大杯稠密模型达32B参数量。小尺寸模型Qwen3-4B在数学、代码能力上媲美大10倍模型。

本系列包含2个MoE模型和6个稠密模型,均在Apache 2.0许可下开源。后训练模型及预训练基座模型已在Hugging Face、ModelScope和Kaggle等平台开放。推荐使用SGLang、vLLM等框架部署,或Ollama、LMStudio等本地使用。

Qwen3支持MCP,增强环境交互能力,提出思考/非思考模式切换。思考模式逐步推理,非思考模式快速响应。“7米甘蔗过2米门”问题,思考模式耗时38912个token,非思考模式仅需2秒。

Qwen3预训练数据达36万亿token,涵盖119种语言和方言。预训练分三阶段:S1阶段4K上下文长度,S2阶段增加知识密集型数据,S3阶段扩展至32K上下文长度。后训练分四阶段优化模型性能。

Qwen3 Dense基础模型整体性能媲美更大规模的Qwen2.5,MoE模型仅10%激活参数即可达到相似效果。Qwen团队希望通过开源推动研究与开发,赋能全球用户。更多详情可访问官方链接。

原文链接
本文链接:https://kx.umi6.com/article/17934.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
应激的Llama,开源的困局
2025-04-25 15:14:47
阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发
2025-06-12 16:39:43
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
24小时热文
更多
扫一扫体验小程序