Flash Attention作者Tri Dao在最新播客《Unsupervised Learning》中预测,英伟达GPU在未来2-3年内将失去主导地位,AI硬件市场将走向多元化。他认为,随着专用芯片的兴起,推理成本有望再降10倍,而Transformer架构已足够稳定,可支撑未来AI发展。他指出,Mixture of Experts(MoE)等技术推动了模型稀疏化与推理优化,同时低延迟、高吞吐等多样化工作负载需求将催生不同硬件优化方向。此外,他对AI达到专家水平表示期待,认为现有架构虽能实现AGI,但更高效的设计或可大幅降低成本。他还提到,实时视频生成和机器人领域可能成为下一波重要应用。
原文链接
本文链接:https://kx.umi6.com/article/26063.html
转载请注明文章出处
相关推荐
换一换
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
直指端侧痛点 豆包向推理算力又“砍了一刀”:新模型架构最高降本83%
2025-02-12 14:35:40
2026年,7个趋势正在爆发
2026-01-21 09:00:20
下一个DeepSeek,在哪?
2025-02-21 14:50:09
DeepSeek攻占华强北
2025-03-07 10:07:54
谷歌卷土重来:你大爷还是你大爷
2025-12-03 09:08:14
Meta挖走苹果顶级设计师 加速AI硬件布局
2025-12-04 20:45:13
联发科提出“AI的下一站”!还有到达的最优解
2025-04-15 18:40:29
硬件不行,AI失灵,AI硬件创业者的第一道生死关
2025-09-18 11:50:42
推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
2025-02-12 12:26:20
全球117家公司激战消费级AI硬件市场,七成为中国公司
2025-01-24 15:45:47
科创50八月创三年新高 AI主线全面爆发 “寒王”之外另有这些牛股领跑
2025-08-30 15:54:51
AI硬件十点洞察
2024-12-06 17:28:38
696 文章
560796 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17