综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月28日,阿里通义千问团队在人工智能顶级会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。其研究首次揭秘了注意力门控机制对大模型性能和训练的影响,突破了当前大模型训练瓶颈,推动AI技术发展。本次会议共接收全球2万多篇投稿中的约25%,仅4篇获最佳论文奖,入选概率不及万分之二。研究通过大规模实验清晰揭示门控注意力的作用原理,并展示其优化方案,在引入1%额外参数的情况下,可显著降低困惑度并提升基准评测表现。该成果已应用于Qwen3-Next模型,提升性能与鲁棒性,相关技术与模型均已开源。目前,阿里千问已开源300多款模型,全球下载量超7亿次,衍生模型达18万个,位居全球第一。
原文链接
加载更多
暂无内容