综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月29日,恒润股份旗下润六尺-天顿大湾区AI推理算力产业基地正式启动运营。基地目前已部署超1400台服务器,提供逾3000P推理算力,未来将新增约3000台高性能服务器,总规模达万P以上,成为华南地区最大AI算力集群之一。该基地由深圳润六尺科技与深圳天顿数据合作建设,首批签约生态伙伴包括龙岗移动、联通、电信、龙岗城投集团等多家企业及机构。项目助力深圳及龙岗区打造国家人工智能产业高地,推动区域AI技术发展。
原文链接
1月5日,英伟达CEO黄仁勋在CES演讲中发布新一代AI平台Rubin,包含六款新芯片:Vera CPU、Rubin GPU、NVLink 6交换机等。其中,Rubin GPU搭载第三代Transformer引擎,推理算力达50PFLOPS,是Blackwell的5倍。该平台已全面投产,基于Rubin的产品预计2026年下半年通过合作伙伴上市。
原文链接
10月9日,360创始人周鸿祎表示,推理算力是未来十年AI产业的核心。他比喻称,训练如读清华积累知识,推理则是解决实际问题。行业过去重训练轻推理,但ChatGPT、医疗、工业等场景的推理需求可能暴增万倍。训练需高成本暴力计算,推理则追求快、省、稳,适配终端设备。OpenAI与AMD合作研发推理芯片MI450,因其在推理场景更高效。周鸿祎认为,推理芯片门槛较低,是中国弯道超车的机会,抓住推理算力才能让AI从知识积累迈向产业价值释放。
原文链接
9月13日,AI领域焦点从模型参数增长转向推理算力需求。英伟达发布专为长上下文推理设计的Rubin CPX GPU,称其投资回报率可达50倍,远超以往产品,并在MLPerf推理基准测试中创纪录。甲骨文创始人Larry Ellison指出,AI推理市场将远大于训练市场,且推理算力正被快速耗尽。数据显示,Google、微软和字节等大厂Token调用量呈爆发式增长,行业对长上下文需求激增。东吴证券认为,Rubin CPX推出标志着算力基建进入分工协作新阶段,硬件与软件耦合度提升,GPU、存储等相关厂商有望受益。
原文链接
近日,中国开源大模型DeepSeek-R1发布,其557.6万美元的预训练成本仅为OpenAI GPT-4的十分之一,且功能不逊色,引发全球关注。DeepSeek-R1的开源特性让欧洲、印度等国家的创业者和投资人看到了进入AI领域的希望。此前,AI领域主要由中国和美国主导,其他国家难以涉足,但DeepSeek的出现打破了这一局面,推动了AI应用的快速发展。开源大模型降低了训练成本,使得AI竞争重点从训练转向推理。预计到2026年底,推理算力需求将占AI总需求的九成。中国AI应用已快速涌现,如夸克接入阿里通义千问基模,实现多种实用功能;Manus可自动分析简历;米哈游推出的AI游戏《Whispers from the Star》提供沉浸式体验。AI应用的爆发不仅带动下游产业发展,还刺激上游芯片需求,利好国产芯片崛起。未来,AI应用将进一步渗透各行各业,为中国新质生产力发展创造机遇。
原文链接
财联社3月9日电,民生证券计算机团队发布报告指出,随着DeepSeek等头部AI模型的发展,AI应用正加速落地,AI Agent将显著增加推理算力需求。DeepSeek对算力生态的优化有望激发国产算力潜力。国民级应用模型的使用将长期推动算力需求上升,降低AI行业门槛和成本。在大国科技竞争背景下,AI算力国产化成为必然趋势,为国产算力带来重要发展机遇。
原文链接
财联社2月24日讯,美国TMT投资人Gavin Baker发布推文分析未来AI竞争趋势,获马斯克点赞。Baker认为,AI产业变革加速,OpenAI的领先优势将缩小,数据成为核心竞争力。谷歌、Meta等巨头通过垄断数据构建护城河。目前,OpenAI、Google、xAI等公司模型技术水平接近。Baker指出,‘Scaling Law’的优势窗口正在关闭,未来模型需依赖独特数据源。他认为,AI计算将转向95%的推理阶段,预训练仅占5%,强调基础设施的重要性。
原文链接
2025年,DeepSeek的兴起引发智算市场剧变,短期内算力需求激增。浪潮信息高级副总裁刘军透露,近期咨询购买AI服务器的客户数直线上升。《报告》显示,2024年中国人工智能算力市场规模达190亿美元,2025年将增至259亿美元,同比增长36.2%。DeepSeek不仅在推理端推动市场,还在预训练和后训练端带来重大影响。未来18个月,软件和服务支出将是企业生成式AI项目的主要方向。公有云和私有云市场都将因DeepSeek模型调用或部署迎来竞争。浪潮信息2月11日推出的元脑R1推理服务器受到关注,单机即可运行DeepSeek R1 671B模型。
原文链接
12月26日,DeepSeek-V3发布并开源,提升了训练效率和推理速度。该模型参数为6710亿,通识和专业知识测试表现优异,MMLU pro正确率75.9%,MATH 500正确率90.2%。相比GPT-4,DeepSeek-V3的训练成本更低,仅为GPT-4的1/6.2。DeepSeek-V3的发布有望加速AI应用落地,特别是在办公、教育、金融等领域。国产模型性价比提升,AI应用将依托丰富生态和成熟流量加速各领域落地。
原文链接
2025年或成为全终端AI Agent爆发元年,德邦证券预测AI Agent网络有望初具规模,终端将率先放量,随后是全行业的广泛应用,预计AI应用的商业模式闭环也将形成。AI Agent功能的完善将提升其渗透率,带动以手机为代表的终端市场增长。目前,大模型训练端的算力需求放缓,但推理算力需求显著增加,这将促使大模型和应用厂商更加重视推理侧的落地,开发出标志性的AI应用。参照1997年互联网落地的重要时刻,建议关注基础设施中的AI推理算力建设和未来AI终端及应用的放量趋势。此信息截至2023年9月29日。
原文链接
加载更多
暂无内容