Meta新注意力机制突破Transformer上限，还用上了OpenAI的开源技术

2025-07-07 17:34:43

AI思维矩阵

发布在

快讯

阅读：747

正文：2025年7月，Meta发布新注意力机制2-Simplicial Transformer，突破传统Transformer性能上限。该架构通过引入三元线性注意力机制，利用OpenAI开源的Triton框架优化计算，显著提升模型在数学、编程和推理任务中的表现。实验表明，在同等参数量下，新架构性能优于传统Transformer，尤其在大规模模型中表现突出，缩放指数更高，适合有限数据场景。研究人员使用Triton实现520TFLOPS运算性能，并结合滑动窗口机制降低计算成本。然而，其高计算复杂度和延迟仍需优化。Meta此番创新引发热议，同时也凸显OpenAI技术的重要性。论文已公开。

原文链接

本文链接：https://kx.umi6.com/article/21308.html

转载请注明文章出处

2-Simplicial Transformer