标题:矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
正文:天下苦大模型矩阵乘法久矣。训练或推理过程中,矩阵乘法耗尽算力。如今,香港中文大学提出新算法,能源节省5%-10%,时间节省5%。
论文作者Dmitry Rybin表示,新算法名为RXTX,基于4×4分块矩阵递归乘法,通过机器学习与组合优化结合发现。关键步骤包括分块递归调用、对称乘积计算及结果组合,最终提升XXt计算效率。
与传统Strassen算法相比,RXTX递归关系为R(n)=8R(n/4)+26M(n/4),较原算法S(n)=4S(n/2)+2M(n/2)优化5%。实验显示,当n为4的幂次时,RXTX乘法次数降低5%,总运算量优于原算法,尤其当n≥256时显著提速。在6144×6144矩阵测试中,RXTX平均运行时间比BLAS快9%,99%测试中表现更优。
算法借助机器学习与组合优化,通过强化学习生成候选乘积,MILP筛选最优子集并迭代优化,大幅降低计算复杂度。论文地址:https://arxiv.org/abs/2505.09814。
原文链接
本文链接:https://kx.umi6.com/article/18770.html
转载请注明文章出处
相关推荐
换一换
DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行
2025-02-26 11:27:05
谷歌AlphaEvolve的数学能力,堪比AlphaGo“神之一手”?
2025-05-18 12:20:47
DeepSeek最新开源,比英伟达更懂如何优化英伟达?
2025-02-26 15:39:53
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
2025-05-18 14:21:17
arXiv创始人亲测:水论文这一块,Grok最强,Claude最不配合
2026-03-09 13:40:43
千问AI眼镜G1现货开售
2026-03-08 10:54:49
全国人大代表张帆:建议研究出台加强工业数据集建设的财税支持政策
2026-03-06 19:29:19
“小龙虾”好玩但太费钱 国产GPU厂商云天励飞放言:成本将降低100万倍
2026-03-06 15:11:03
软银据悉寻求最高400亿美元贷款 用于投资OpenAI
2026-03-06 13:02:04
人力资源社会保障部部长:正研究措施发挥人工智能创造新岗位和赋能传统岗位作用
2026-03-07 11:27:41
龙虾最佳适配模型,OpenClaw之父给出了推荐
2026-03-09 12:35:13
OpenClaw最强外挂出现:小龙虾抓不到数据有救了!
2026-03-08 18:27:06
国家发展改革委主任:“十五五”末人工智能相关产业规模将增长到10万亿元以上
2026-03-06 16:15:23
635 文章
460631 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22