1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年12月,华为诺亚方舟实验室推出全新架构Nexus,革新Transformer核心机制。通过高阶注意力机制(Higher-Order Attention Mechanism),Nexus解决了传统Attention在多跳、多点逻辑推理中的不足,显著提升模型复杂推理能力。实验表明,Pythia-70M模型在SciQ数据集准确率提升7%,Qwen2.5系列在数学推理任务中表现更优,且无需增加参数量。Nexus采用递归框架与权重共享策略,实现高效表达密度提升,适用于小模型训练和大模型改造。研究团队计划将Nexus扩展至视觉与多模态任务,进一步优化其性能。论文已发布于arXiv。

原文链接
本文链接:https://kx.umi6.com/article/29751.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为发布AI新技术:单卡同时承载多AI工作负载 提升硬件资源利用率
2025-11-21 16:31:21
华为首次在海外展出全液冷AI超节点
2026-03-03 07:41:25
华为开源 SINQ AI 量化技术:显存占用最高削减 70%,单张 RTX 4090 能干 A100 的活
2025-10-06 08:32:49
昇腾384超节点真机将亮相WAIC2025
2025-07-18 10:38:43
华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平台,破解 AI“安全与性能”难题
2025-09-21 12:44:49
华为全球征集!悬赏300万元解决这两大技术难题
2025-12-26 17:56:26
海螺集团董事长杨军拜会任正非
2026-01-27 15:21:51
全球首个具身智能本科专业!上海交大公告,联合华为培养,李飞飞高徒带队
2025-11-30 13:09:17
华为汪涛:到2030年全球将有近百亿个人AI Agent
2025-06-19 11:48:42
南钢集团联合华为发布“元冶・钢铁大模型”,实现全流程、全产业链数据贯通与智能升级
2025-06-24 00:30:19
华为发布盘古大模型5.5
2025-06-20 17:09:56
时隔5年 任正非再次与上海交大校长会面
2025-07-23 13:51:33
华为首次海外发布超节点产品
2026-03-01 20:22:22
24小时热文
更多
扫一扫体验小程序