1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年12月,华为诺亚方舟实验室推出全新架构Nexus,革新Transformer核心机制。通过高阶注意力机制(Higher-Order Attention Mechanism),Nexus解决了传统Attention在多跳、多点逻辑推理中的不足,显著提升模型复杂推理能力。实验表明,Pythia-70M模型在SciQ数据集准确率提升7%,Qwen2.5系列在数学推理任务中表现更优,且无需增加参数量。Nexus采用递归框架与权重共享策略,实现高效表达密度提升,适用于小模型训练和大模型改造。研究团队计划将Nexus扩展至视觉与多模态任务,进一步优化其性能。论文已发布于arXiv。

原文链接
本文链接:https://kx.umi6.com/article/29751.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为发布Flex:ai AI容器技术 实现单卡同时承载多个AI工作负载
2025-11-21 15:31:39
中国AI芯片市场迎巨变:英伟达2026年将仅占8%
2025-12-05 12:26:55
华为首次线下展出昇腾 384 超节点:业界最大规模 384 卡高速总线互联
2025-07-26 16:43:24
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
华为 Atlas 950 SuperCluster 50 万卡超集群 2026 年 Q4 上市
2025-09-18 13:53:18
华为发布三款AI SSD系列新品:最高245TB 随机写高达1500K IOPS
2025-08-27 18:07:34
华为发布AI推理新技术 将于今年9月正式开源
2025-08-12 23:24:22
华为与深交所联合发布证券行业法规大模型,问答准确率超 90%
2025-11-28 20:47:40
华为投资物理 AI:首家国产世界模型公司“极佳视界”完成新一轮亿元级 A1 轮融资
2025-11-12 13:01:59
华为 × 崖州湾国家实验室发布“繁 | 未来农业智能枢纽”:AI 有望让育种流程效率提升 30%
2025-11-11 21:29:02
昇腾384超节点真机将亮相WAIC2025
2025-07-18 10:38:43
全球首个具身智能本科专业!上海交大公告,联合华为培养,李飞飞高徒带队
2025-11-30 13:09:17
华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平台,破解 AI“安全与性能”难题
2025-09-21 12:44:49
24小时热文
更多
扫一扫体验小程序