
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月17日,在2025 RISC-V全球峰会上,Tenstorrent首席执行官Jim Keller表示,RISC-V架构使AI与CPU的协同设计成为可能。他指出,AI任务涵盖多种形态,包括依赖CPU、AI加速器及两者混合的处理模式,交互频繁。AI将推动代码生成和硬件设计创新,而RISC-V允许开发者同时设计AI与CPU解决方案,为行业带来更多创新机会。(特约记者 王楚凡)
原文链接
标题:对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
在北京万泉河畔的写字楼内,我见到了季宇,一位前华为“天才少年”、昇腾编译器专家、清华大学计算机科学博士以及CCF优秀博士学位论文获得者。他两年前离开华为创办了行云集成电路,专注于自研GPU。
他的办公室整洁得令人惊叹,这种极致的秩...
原文链接
3月31日消息,Arm Holdings预计今年年底前将在全球数据中心CPU市场占据50%份额,较去年的15%大幅提升。这一增长得益于AI产业的快速发展。Arm芯片作为AI计算系统的“主机”芯片,负责调度其他AI芯片,例如英伟达的Grace芯片。相比英特尔和AMD的产品,Arm芯片功耗更低,吸引云计算企业采用。此外,Arm更多地应用于数据中心芯片,版税收入更高。尽管过去二十年Arm在数据中心市场进展缓慢,但随着软件优先适配Arm架构,亚马逊、谷歌、微软等已开始采用Arm架构芯片。Arm总部位于英国,软银集团持有90%股份。
原文链接
标题:天翼云CPU实例部署DeepSeek-R1模型最佳实践
来源:天翼云网站 & 量子位公众号 QbitAI
本文介绍如何在纯CPU环境下部署基于AMX加速的DeepSeek-R1模型,以及在天翼云EMR实例上部署DeepSeek-R1-Distill-Qwen-7B蒸馏模型。大模型因参数...
原文链接
2月28日,阿里巴巴达摩院旗下玄铁宣布推出首款基于开源RISC-V架构的服务器级CPU IP核——玄铁C930,预计3月开始交付。该芯片将应用于AI加速、车载等领域。阿里巴巴集团CEO吴泳铭宣布未来三年将投资超3800亿元用于建设云和AI硬件基础设施。RISC-V市场规模预计到2030年将达到927亿美元,年均复合增长率47.4%。玄铁C930的通用算力性能达SPECint2006基准测试15/GHz,并支持AI算力。此外,阿里还将推出一系列玄铁处理器家族成员,如C908X、R908A、XL200等。
原文链接
标题:配这种CPU,GPU单卡就能跑满血DeepSeek-R1,至强+ AMX让预填充速度起飞
DeepSeek-R1火爆全球,但推理服务器常宕机,且高昂成本使中小团队望而却步。市面上的“本地部署”方案多为缩水版。近期,清华大学KVCache.AI团队发布的KTransformers开源项目更新,支...
原文链接
2月9日,飞腾信息技术有限公司宣布其腾云S5000C和腾锐D3000成功实现对DeepSeek全系列大模型的端到端支持,覆盖数据中心和终端场景。本地部署的推理效率与国外同类产品相当。DeepSeek-V2.5 236B大模型已在飞腾腾云S5000C平台上稳定运行,整体性能达国外平台的80%左右。飞腾技术团队还在腾云S5000C和平锐D3000上进行了DeepSeek的本地部署验证,形成整体解决方案。
原文链接
标题:把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
CPU+GPU协作下,模型KV缓存压力得到缓解。CMU、华盛顿大学及Meta AI的研究团队提出MagicPIG,通过在CPU上应用LSH采样技术,有效解决了GPU内存容量限制的问题。与仅使用GPU的注意力机制相比,MagicP...
原文链接
俄罗斯服务器厂商Graviton宣布开始供货首批AI/HPC服务器,采用自研的S2124B CPU,双路配置共96核心,主频2.0GHz。该处理器支持最多8块GPU计算卡,内存搭配DDR4-3200,硬盘支持12块SATA或12块NVMe U.3。处理器疑似为Baikal-S,配备48个A75架构核心,频率低于先前版本。官方未明确支持的具体GPU型号,但其性能数据类似NVIDIA H100。12月27日的消息显示,这些服务器可能无法获得NVIDIA的官方支持,实际性能表现有待验证。
原文链接
**摘要:**
近日,Arm Tech Symposia年度技术大会在上海和深圳举行,吸引了超过3500名行业专家参与。AI正迎来前所未有的发展机遇,预计到2026年底,中国将有1.7亿台支持AI的智能手机及55%的PC支持AI功能。AI不仅改变了手机解锁等日常操作,还在科研、医疗等领域展现出巨大潜力。尽管GPU在AI大模型训练中占据主导地位,但CPU凭借其通用性和适应性,仍不可替代。Arm基础设施事业部产品解决方案副总裁Dermot O'Driscoll指出,AI需求推动了计算方式的变革,需打造强大的计算平台以满足未来需求,包括更高性能、能效及快速上市的解决方案。
(注:本文根据原文提炼,保留关键信息,适合作为新媒体平台发布的内容,总字数约240字。)
原文链接
加载更多

暂无内容