11月28日,阿里通义千问团队在人工智能顶级会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。其研究首次揭秘了注意力门控机制对大模型性能和训练的影响,突破了当前大模型训练瓶颈,推动AI技术发展。本次会议共接收全球2万多篇投稿中的约25%,仅4篇获最佳论文奖,入选概率不及万分之二。研究通过大规模实验清晰揭示门控注意力的作用原理,并展示其优化方案,在引入1%额外参数的情况下,可显著降低困惑度并提升基准评测表现。该成果已应用于Qwen3-Next模型,提升性能与鲁棒性,相关技术与模型均已开源。目前,阿里千问已开源300多款模型,全球下载量超7亿次,衍生模型达18万个,位居全球第一。
原文链接
本文链接:https://kx.umi6.com/article/29344.html
转载请注明文章出处
相关推荐
换一换
阿里千问大模型上线国家超算平台!一体机发布、AI编程落地
2025-03-10 18:54:56
阿里千问(Qwen)衍生模型数量破 10 万,位居全球开源模型榜首
2025-02-25 17:02:40
全球AI顶会 NeurIPS 2024温哥华开幕,中国校企上百篇论文被收录
2024-12-11 16:36:37
夸克AI眼镜发布 搭载阿里千问
2025-11-27 15:48:57
超越Gemini3、GPT5.1,阿里千问登顶空间推理全球冠军
2025-11-26 15:49:46
把1个脑洞发展成1场顶会workshop,阿里妈妈只用了1年|直击NeurIPS’24
2024-12-16 19:43:45
中国唯一!阿里千问斩获全球AI顶会最佳论文
2025-11-28 17:38:06
MIT教授NeurIPS演讲公开歧视中国学生,大会官方认错、本人道歉
2024-12-16 09:43:32
参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败
2024-12-24 11:30:10
夸克发布AI浏览器 融合阿里千问
2025-11-26 14:49:57
阿里千问团队谈“对标 ChatGPT”:希望他们没有的能力我们有
2025-11-17 12:22:42
阿里千问开始蹬鼻子上脸了
2025-11-28 15:32:48
阿里千问进入电脑桌面,与夸克AI浏览器深度融合
2025-11-26 16:51:23
566 文章
335032 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07