
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
质量无损,算力减半!达摩院开源视觉生成新架构DyDiT亮相ICLR 2025
达摩院在ICLR 2025上发布的DyDiT架构,通过动态调整时间步长与空间区域的计算分配,成功将DiT模型的推理算力削减51%,生成速度提升1.73倍,同时保持生成质量几乎无损。此方法仅需3%的微调成本,即可显著优化...
原文链接
近期,英伟达H20显卡因DeepSeek热潮需求激增,咨询量暴涨几十倍,价格较年前上涨约10万元。H20虽性能逊于H100,但在AI推理场景中显存充足且价格更具优势,受某互联网大厂下单10-20万卡影响,市场订单量显著增长。DeepSeek开源模型通过算法创新,推动AI计算从“训练为主”转向“推理为主”,其V3版本采用MoE架构提升推理效率,R1-Zero则通过强化学习降低成本。这一趋势下,AI Infra厂商如PPIO通过分布式架构优化算力调度,实现更高弹性与稳定性,春节期间ToB服务可用性达99.9%。DeepSeek的开源模式正重构算力逻辑,预计未来推理芯片市场将呈现百花齐放格局。
原文链接
标题:DeepSeek的三场英伟达GTC秀
最早赏识DeepSeek的是英伟达。早在2022年春天,幻方AI(DeepSeek前身)就受邀在英伟达GTC舞台上连续三年演讲。DeepSeek的崛起也给英伟达带来冲击,其推理模型R1使英伟达市值蒸发6000亿美元。
DeepSeek的基础模型V3与推理模...
原文链接
加载更多

暂无内容