Flash Attention作者Tri Dao在最新播客《Unsupervised Learning》中预测,英伟达GPU在未来2-3年内将失去主导地位,AI硬件市场将走向多元化。他认为,随着专用芯片的兴起,推理成本有望再降10倍,而Transformer架构已足够稳定,可支撑未来AI发展。他指出,Mixture of Experts(MoE)等技术推动了模型稀疏化与推理优化,同时低延迟、高吞吐等多样化工作负载需求将催生不同硬件优化方向。此外,他对AI达到专家水平表示期待,认为现有架构虽能实现AGI,但更高效的设计或可大幅降低成本。他还提到,实时视频生成和机器人领域可能成为下一波重要应用。
原文链接
本文链接:https://kx.umi6.com/article/26063.html
转载请注明文章出处
相关推荐
换一换
坏了,我感觉手机把我当agent 了
2025-08-24 10:12:06
从1980年以来的硅谷PC创新,看AI硬件的时代机遇
2024-11-08 16:30:40
钉钉启动“D计划”拟推AI硬件新品 类似“豆包手机”
2025-12-19 19:08:39
推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
2025-02-12 12:26:20
算力成最大技术瓶颈,OpenAI 首款 AI 硬件恐推迟发布
2025-10-06 10:35:13
大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!
2024-12-11 17:30:27
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
2025-12-26 15:45:08
传字节跳动AI眼镜有新动作! 已和供应商“搭上线”
2025-04-13 15:45:24
“O链”牵动果链 千亿龙头T字板 AI硬件带来新机遇?
2025-09-22 11:57:33
英伟达发布新 AI 硬件:H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片
2024-11-19 12:42:47
能懂孩子、懂爸妈、还懂宠物,这届AI硬件太会了
2025-10-25 15:28:07
等效 5000 万块英伟达 H100 GPU,马斯克公布 xAI 五年算力目标
2025-07-23 09:46:53
633 文章
422717 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44