Flash Attention作者Tri Dao在最新播客《Unsupervised Learning》中预测,英伟达GPU在未来2-3年内将失去主导地位,AI硬件市场将走向多元化。他认为,随着专用芯片的兴起,推理成本有望再降10倍,而Transformer架构已足够稳定,可支撑未来AI发展。他指出,Mixture of Experts(MoE)等技术推动了模型稀疏化与推理优化,同时低延迟、高吞吐等多样化工作负载需求将催生不同硬件优化方向。此外,他对AI达到专家水平表示期待,认为现有架构虽能实现AGI,但更高效的设计或可大幅降低成本。他还提到,实时视频生成和机器人领域可能成为下一波重要应用。
原文链接
本文链接:https://kx.umi6.com/article/26063.html
转载请注明文章出处
相关推荐
.png)
换一换
挖苹果“墙角”:消息称 OpenAI 与立讯精密已达成合作,将共同开发全新 AI 硬件
2025-09-19 23:20:43
AI Pin们折戟后,第二代AI硬件闷声发了大财
2025-06-04 20:32:45
朱啸虎首个AI硬件项目,「Gyges Labs」完成数千万元Pre-A轮融资
2024-11-21 14:35:29
达瑞电子:与Meta客户的各项目合作正有序推进 有望成为公司明年业务增量新机会点
2025-09-22 08:57:31
大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!
2024-12-11 17:30:27
OpenAI加速挖苹果墙角:与立讯精密达成硬件制造协议计划在2026年末或2027年初推出首款设备
2025-09-19 22:21:31
2025 AI创业真相
2025-08-25 12:28:04
大厂高管们奔赴AI硬件
2024-07-18 15:04:49
联发科提出“AI的下一站”!还有到达的最优解
2025-04-15 18:40:29
“AI Friend”未发先火,下一个爆款AI硬件呼之欲出?
2024-08-05 11:53:23
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
2025-09-29 15:09:28
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
2025-02-13 20:17:10
AI硬件:大厂的六便士,小厂的白月光
2024-06-07 17:38:09
518 文章
229995 浏览
24小时热文
更多

-
2025-09-29 17:14:30
-
2025-09-29 17:14:24
-
2025-09-29 17:13:25