矩阵乘法 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

重大突破！科学家发明光速 AI 计算架构，有望消除性能瓶颈

11月24日，芬兰阿尔托大学研究团队发布重大突破，成功演示新一代光学计算架构POMMM（并行光学矩阵-矩阵乘法器），有望解决AI模型训练中的性能瓶颈。该技术利用相干光完成矩阵运算，无需电子环路，运算延迟达纳秒级，远胜传统GPU的微秒级。原型机测试显示，其精度已满足边缘推理需求，尽管能效目前仅为2.62 GOP/J，但团队预计三年内通过集成光子芯片，能效可达300 GOP/J，超越现有GPU百倍。研究代码已开源，吸引全球关注。不过，大规模量产或需五年以上时间。

原文链接

虚拟织梦者

11-25 14:54:58

POMMM

光速AI计算架构

并行光学矩阵乘法器

分享至

打开微信扫一扫

内容投诉

生成图片

矩阵乘法可以算得更快了！港中文10页论文证明：能源、时间均可节省

标题：矩阵乘法可以算得更快了！港中文10页论文证明：能源、时间均可节省正文：天下苦大模型矩阵乘法久矣。训练或推理过程中，矩阵乘法耗尽算力。如今，香港中文大学提出新算法，能源节省5%-10%，时间节省5%。论文作者Dmitry Rybin表示，新算法名为RXTX，基于4×4分块矩阵递归乘法，通...

原文链接

Oasis

05-18 14:21:17

RXTX算法

矩阵乘法

能量节省

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌AlphaEvolve的数学能力，堪比AlphaGo“神之一手”？

谷歌AlphaEvolve的数学能力堪比AlphaGo“神之一手”？数学能力几乎媲美AlphaGo的围棋水平？这是研究员对AlphaEvolve的最新评价。不久前，谷歌DeepMind联合多位顶尖科学家推出了“通用科学人工智能”AlphaEvolve，直接刷新了56年来4x4矩阵乘法效率的基准...

原文链接

GhostPilot

05-18 12:20:47

AlphaEvolve

人工智能

矩阵乘法

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek最新开源，比英伟达更懂如何优化英伟达？

DeepSeek开源周第三弹来袭！DeepGEMM仅用300行代码便实现超越专家级优化的矩阵乘法，在Hopper GPU上达到1350 TFLOPS的速度。它支持密集和MoE GEMM，且无需过多依赖，简洁易用。 DeepGEMM使用FP8格式提高计算速度和内存效率，通过精细缩放解决精度问题。它基于...

原文链接

Oasis

02-26 15:39:53

DeepGEMM

优化技术

矩阵乘法

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek开源第三弹：V3/R1训练推理关键秘籍，核心代码仅300行

标题：DeepSeek开源第三弹：V3/R1训练推理秘籍，核心代码仅300行开源周第三天，DeepSeek展示了训练推理V3/R1背后的“动力”——DeepGEMM，一个支持密集和混合专家矩阵乘法的FP8 GEMM库。GEMM是线性代数的基本运算，广泛应用于科学计算和深度学习领域。 DeepGEM...

原文链接