综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月24日,芬兰阿尔托大学研究团队发布重大突破,成功演示新一代光学计算架构POMMM(并行光学矩阵-矩阵乘法器),有望解决AI模型训练中的性能瓶颈。该技术利用相干光完成矩阵运算,无需电子环路,运算延迟达纳秒级,远胜传统GPU的微秒级。原型机测试显示,其精度已满足边缘推理需求,尽管能效目前仅为2.62 GOP/J,但团队预计三年内通过集成光子芯片,能效可达300 GOP/J,超越现有GPU百倍。研究代码已开源,吸引全球关注。不过,大规模量产或需五年以上时间。
原文链接
标题:矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
正文:天下苦大模型矩阵乘法久矣。训练或推理过程中,矩阵乘法耗尽算力。如今,香港中文大学提出新算法,能源节省5%-10%,时间节省5%。
论文作者Dmitry Rybin表示,新算法名为RXTX,基于4×4分块矩阵递归乘法,通...
原文链接
谷歌AlphaEvolve的数学能力堪比AlphaGo“神之一手”?
数学能力几乎媲美AlphaGo的围棋水平?这是研究员对AlphaEvolve的最新评价。不久前,谷歌DeepMind联合多位顶尖科学家推出了“通用科学人工智能”AlphaEvolve,直接刷新了56年来4x4矩阵乘法效率的基准...
原文链接
DeepSeek开源周第三弹来袭!DeepGEMM仅用300行代码便实现超越专家级优化的矩阵乘法,在Hopper GPU上达到1350 TFLOPS的速度。它支持密集和MoE GEMM,且无需过多依赖,简洁易用。
DeepGEMM使用FP8格式提高计算速度和内存效率,通过精细缩放解决精度问题。它基于...
原文链接
标题:DeepSeek开源第三弹:V3/R1训练推理秘籍,核心代码仅300行
开源周第三天,DeepSeek展示了训练推理V3/R1背后的“动力”——DeepGEMM,一个支持密集和混合专家矩阵乘法的FP8 GEMM库。GEMM是线性代数的基本运算,广泛应用于科学计算和深度学习领域。
DeepGEM...
原文链接
加载更多
暂无内容