
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月5日,百度智能云宣布成功点亮国内首个自研万卡集群——昆仑芯三代万卡集群,并计划进一步点亮3万卡集群。该项目突破了硬件扩展性瓶颈,采用了创新性散热方案解决能效与散热问题。通过高效并行化任务切分策略,集群MFU提升至58%,且保障有效训练率达到98%。此外,建设高性能网络优化拓扑结构,使带宽有效性达到90%以上。此次成就标志着中国在高性能计算领域取得重要进展。
原文链接
小米正在搭建GPU万卡集群,加速AI大模型研发。该计划已施行数月,雷军亲自领导。小米去年4月组建AI实验室大模型团队,今年5月小米大语言模型MiLM通过备案。未来将应用于小米汽车、手机、智能家居等产品中,实现端云结合的智能提升及多设备协同。
原文链接
摘要:
近期,Meta发布的关于Llama 3.1预训练的论文揭示了一个令人关注的事实:在为期54天的预训练期间,Llama 3.1遇到了频繁的故障问题,平均每3小时故障一次,总共有466次中断,其中419次为意外中断,且大部分归咎于硬件问题,尤其是GPU,占总数的58.7%。尽管如此,Llama...
原文链接
10万卡集群:通往AGI的新门票
美国大模型公司的标配
10万卡集群正成为美国大模型公司的标配。拾象发布的AI时代的纳斯达克指数AGIX Index,重点关注AI行业的“硬件投入—基础设施建设—应用爆发”三个阶段,其中硬件和基础设施是AGIX Index的焦点领域。
AGI的硬件投入持续升温
新一轮...
原文链接
#国产芯片大战升级# 2024年世界人工智能大会在上海举行,算力成为焦点。原本单一的选择现在变得多元,华为、百度昆仑芯、天数智芯等多家企业亮相H2馆,展示最新芯片与智算中心技术。尽管芯片厂商展示策略谨慎,但推理芯片销售量激增,如天数智芯、燧原去年以来出货量过万,瞄准云端及端侧市场。国产芯片正挑战英伟达主导地位,特别是在推理场景,由于功耗和成本优势,推理芯片迎来爆发前夜。同时,部分厂商如摩尔线程推出万卡规模智算集群,但高额投入与商业化落地的不确定性引发讨论。万卡集群虽被视为万亿参数大模型的基础设施,但实际操作中面临软件集成和技术挑战,仍处于少数领先企业的探索阶段。
原文链接
7月4-7日,世界人工智能大会在上海举办,算力成为焦点。去年单一选择的GPU市场如今变化显著,H2馆众多芯片厂商亮相,包括华为、百度昆仑芯、天数智芯等。尽管芯片厂商展示策略谨慎,但推理芯片销售量增长明显,如天数智芯、燧原去年出货量已达数万片,主要应用于云端和端侧。国产芯片正分化为追求高参数和关注落地应用两派,推理芯片尤其在端侧迎来爆发,部分芯片如"爱芯元智"的小芯片因本地运行和成本优势供不应求。同时,国产芯片正从千卡迈向万卡规模,如摩尔线程的"夸娥"方案,但万卡集群的高昂成本和软件挑战引发业界讨论,少数头部企业和部分芯片厂商如华为、摩尔线程已涉足这一领域。
原文链接
"中国首款全功能GPU万卡集群由'中国英伟达'摩尔线程推出,国内首个兼容CUDA的高性能集群,总计超10000张GPU,算力超万P,专为万亿参数模型设计。集群具有高效率、长稳定性和生态兼容性,挑战了技术复杂性。摩尔线程凭借前瞻策略,迎合并推动国产GPU进入‘万卡时代’,以满足大模型训练的快速增长需求。"
原文链接
加载更多

暂无内容