11月28日,阿里通义千问团队在人工智能顶级会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。其研究首次揭秘了注意力门控机制对大模型性能和训练的影响,突破了当前大模型训练瓶颈,推动AI技术发展。本次会议共接收全球2万多篇投稿中的约25%,仅4篇获最佳论文奖,入选概率不及万分之二。研究通过大规模实验清晰揭示门控注意力的作用原理,并展示其优化方案,在引入1%额外参数的情况下,可显著降低困惑度并提升基准评测表现。该成果已应用于Qwen3-Next模型,提升性能与鲁棒性,相关技术与模型均已开源。目前,阿里千问已开源300多款模型,全球下载量超7亿次,衍生模型达18万个,位居全球第一。
原文链接
本文链接:https://kx.umi6.com/article/29344.html
转载请注明文章出处
相关推荐
换一换
Meta使用阿里千问优化其最新AI模型
2025-12-11 00:19:01
阿里千问:全员大会吃豆包图是 AI 生成的
2025-12-19 18:05:46
阿里千问全员会标语称“干死豆包”?阿里人士辟谣:假的
2025-12-19 16:01:20
AI开始“动手”了,全世界第一个带头的是阿里千问
2026-01-15 13:36:25
华人学子闪耀NeurIPS顶会,背后最大赢家竟是它
2024-12-25 14:04:04
阿里千问发布“2025 十大 AI 提示词”:“股票”排名榜首
2025-12-22 10:42:49
阿里千问衍生模型数量破10万 居全球开源模型榜首
2025-02-25 16:11:24
阿里人士回应“千问全员会标语称‘干死豆包’”:假的
2025-12-19 15:59:00
参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败
2024-12-24 11:30:10
新瓜不断!2024NeurIPS最佳论文,花落字节起诉的实习生
2024-12-04 14:42:29
阿里千问 App 接入高德地图,开始具备物理世界的理解和行动能力
2025-12-18 11:44:51
阿里千问“任务助理 1.0”开启邀测,未来全面免费开放
2026-01-15 11:39:24
阿里千问进入电脑桌面,与夸克AI浏览器深度融合
2025-11-26 16:51:23
616 文章
411986 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44