9月12日,阿里巴巴通义千问发布下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。相比前代Qwen3的MoE模型结构,新架构进行了多项核心改进,包括混合注意力机制、高稀疏度MoE结构、训练稳定性优化以及多token预测机制,以提升推理效率。这一发布标志着阿里巴巴在人工智能领域的持续创新与开源贡献,为开发者和研究者提供了更强大的工具支持。
原文链接
本文链接:https://kx.umi6.com/article/25094.html
转载请注明文章出处
相关推荐
换一换
市场屏息以待!腾讯、阿里财报即将发布 或成外资观测中国AI产业窗口
2025-05-14 13:14:09
阿里巴巴集团CEO吴泳铭:AI是历史性机遇 塑造以科技为核心动力的第二增长曲线
2025-05-16 17:01:32
为 Apple Intelligence 入华铺路?阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版
2025-06-17 08:18:58
汇丰:阿里巴巴千问更新是消费级AI应用方面的“重要一步” 维持“买入”评级
2026-01-16 17:50:35
美图获阿里2.5亿美元战略投资,将在 AI 与电商领域深度合作
2025-05-21 10:00:56
GPT-5来了
2025-08-08 08:09:56
全球首个!我国自研气溶胶-气象耦合预报AI模型试运行
2025-11-27 11:37:16
70亿,阿里香港买楼了
2025-10-20 17:10:09
OpenAI削减了在人工智能模型安全测试上花费的时间和资源
2025-04-11 14:54:42
中信建投:阿里巴巴、OpenAI加码投资 持续推荐算力产业链
2025-09-29 08:09:32
阿里巴巴港股直线拉升 公司已秘密启动“千问”项目 全面对标ChatGPT
2025-11-13 15:08:36
阿里AI TO C 业务启动近千人招聘
2025-08-13 16:39:25
阿里的真正考验,是即将到来的「天王山之战」
2025-11-27 09:26:57
636 文章
437903 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44