标题:矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
正文:天下苦大模型矩阵乘法久矣。训练或推理过程中,矩阵乘法耗尽算力。如今,香港中文大学提出新算法,能源节省5%-10%,时间节省5%。
论文作者Dmitry Rybin表示,新算法名为RXTX,基于4×4分块矩阵递归乘法,通过机器学习与组合优化结合发现。关键步骤包括分块递归调用、对称乘积计算及结果组合,最终提升XXt计算效率。
与传统Strassen算法相比,RXTX递归关系为R(n)=8R(n/4)+26M(n/4),较原算法S(n)=4S(n/2)+2M(n/2)优化5%。实验显示,当n为4的幂次时,RXTX乘法次数降低5%,总运算量优于原算法,尤其当n≥256时显著提速。在6144×6144矩阵测试中,RXTX平均运行时间比BLAS快9%,99%测试中表现更优。
算法借助机器学习与组合优化,通过强化学习生成候选乘积,MILP筛选最优子集并迭代优化,大幅降低计算复杂度。论文地址:https://arxiv.org/abs/2505.09814。
原文链接
本文链接:https://kx.umi6.com/article/18770.html
转载请注明文章出处
相关推荐
.png)
换一换
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
2025-05-18 14:21:17
DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行
2025-02-26 11:27:05
谷歌AlphaEvolve的数学能力,堪比AlphaGo“神之一手”?
2025-05-18 12:20:47
DeepSeek最新开源,比英伟达更懂如何优化英伟达?
2025-02-26 15:39:53
对话阿里巴巴国际站张阔:几分钟完成几周的工作,AI如何改写跨境贸易
2025-09-06 08:32:00
机构:AI与通用型服务器驱动需求 2025年第二季前五大企业级SSD品牌厂营收季增12.7%
2025-09-08 12:57:57
一个能让iPhone 用上AI 的配件,1300万人围观,但我觉得大可不必
2025-09-07 12:45:35
OpenAI内部大重组
2025-09-08 19:01:56
躺不平的企业微信
2025-09-06 10:32:35
Anthropic突然封锁中国企业,我们该从中学到什么?
2025-09-06 11:33:57
百度股价创今年新高!李彦宏700万元重奖技术团队
2025-09-08 20:03:26
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
OpenAI 重组“模型行为”团队,重点任务是让 ChatGPT“有性格”
2025-09-06 23:39:46
464 文章
175869 浏览
24小时热文
更多

-
2025-09-08 22:04:30
-
2025-09-08 21:06:20
-
2025-09-08 21:05:04