1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月12日,阿里云通义团队发布下一代基础模型架构Qwen3-Next,并开源80B-A3B系列模型。新架构通过改进混合注意力机制、高稀疏度MoE结构及多token预测机制,显著提升长上下文和大规模参数下的训练与推理效率。Qwen3-Next-80B-A3B模型拥有800亿参数(激活30亿),支持262K上下文,可外推至101万tokens,性能接近或超越前代模型,而训练成本仅为十分之一,推理吞吐提升十倍以上。Instruct版在评测中接近Qwen3-235B,Thinking版在部分任务上超越Gemini-2.5-Flash-Thinking。模型权重已以Apache-2.0许可发布,可通过Hugging Face、Transformers等框架部署,同时上线第三方平台OpenRouter。

原文链接
本文链接:https://kx.umi6.com/article/25096.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云发布通义 Qwen3-Next 基础模型架构并开源 80B-A3B 系列:改进混合注意力机制、高稀疏度 MoE 结构
2025-09-12 07:06:19
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+性价比提升10倍
2025-09-12 17:15:02
深度复盘2025年C端卡位战
2025-12-06 12:28:46
端侧AI更安心!天玑9500强大双NPU:实现智能体验与隐私安全兼得
2025-12-08 11:25:48
看完最新国产AI写的公众号文章,我慌了!
2025-12-08 21:48:04
科创引领新经济 数智驱动新发展——2025东方财富私募风云际会论坛盛大召开
2025-12-08 15:32:36
西北首台量子计算机落地西安
2025-12-07 08:18:21
谷歌 Gemini 网页版更新“我的内容”文件夹,可一键访问生成的 AI 图像
2025-12-08 08:11:29
加快发展新质生产力 上海自动驾驶测试道路总里程超5200公里
2025-12-07 13:29:51
AI芯片明年6倍增长 百度回应昆仑芯上市计划:不保证会进行
2025-12-07 21:51:01
硅片,洗牌进行时
2025-12-07 14:30:16
广西“十五五”规划建议:全力打造制造业十大现代化支柱产业
2025-12-07 10:27:01
OpenAI:科技、医疗和制造业是人工智能增长最快的行业
2025-12-08 20:47:34
24小时热文
更多
扫一扫体验小程序