推理算力 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

恒润股份旗下润六尺-天顿大湾区AI推理算力产业基地启动运营规划逾万P算力

1月29日，恒润股份旗下润六尺-天顿大湾区AI推理算力产业基地正式启动运营。基地目前已部署超1400台服务器，提供逾3000P推理算力，未来将新增约3000台高性能服务器，总规模达万P以上，成为华南地区最大AI算力集群之一。该基地由深圳润六尺科技与深圳天顿数据合作建设，首批签约生态伙伴包括龙岗移动、联通、电信、龙岗城投集团等多家企业及机构。项目助力深圳及龙岗区打造国家人工智能产业高地，推动区域AI技术发展。

原文链接

AI创想团

01-29 22:47:47

AI推理算力

大湾区

恒润股份

分享至

打开微信扫一扫

内容投诉

生成图片

英伟达发布新一代GPU 推理算力是Blackwell的5倍

1月5日，英伟达CEO黄仁勋在CES演讲中发布新一代AI平台Rubin，包含六款新芯片：Vera CPU、Rubin GPU、NVLink 6交换机等。其中，Rubin GPU搭载第三代Transformer引擎，推理算力达50PFLOPS，是Blackwell的5倍。该平台已全面投产，基于Rubin的产品预计2026年下半年通过合作伙伴上市。

原文链接

AI创意引擎

01-06 07:55:49

Rubin GPU

推理算力

英伟达

分享至

打开微信扫一扫

内容投诉

生成图片

周鸿祎：推理算力才是未来让AI不仅能读清华更能真正赚大钱

10月9日，360创始人周鸿祎表示，推理算力是未来十年AI产业的核心。他比喻称，训练如读清华积累知识，推理则是解决实际问题。行业过去重训练轻推理，但ChatGPT、医疗、工业等场景的推理需求可能暴增万倍。训练需高成本暴力计算，推理则追求快、省、稳，适配终端设备。OpenAI与AMD合作研发推理芯片MI450，因其在推理场景更高效。周鸿祎认为，推理芯片门槛较低，是中国弯道超车的机会，抓住推理算力才能让AI从知识积累迈向产业价值释放。

原文链接

智能视野

10-11 10:26:15

AI落地

推理算力

训推一体

分享至

打开微信扫一扫

内容投诉

生成图片

推理算力“正在耗尽”？百万Token时代来临产业打响新一轮竞逐

9月13日，AI领域焦点从模型参数增长转向推理算力需求。英伟达发布专为长上下文推理设计的Rubin CPX GPU，称其投资回报率可达50倍，远超以往产品，并在MLPerf推理基准测试中创纪录。甲骨文创始人Larry Ellison指出，AI推理市场将远大于训练市场，且推理算力正被快速耗尽。数据显示，Google、微软和字节等大厂Token调用量呈爆发式增长，行业对长上下文需求激增。东吴证券认为，Rubin CPX推出标志着算力基建进入分工协作新阶段，硬件与软件耦合度提升，GPU、存储等相关厂商有望受益。

原文链接

星际Code流浪者

09-13 18:29:27

推理算力

百万Token

长上下文

分享至

打开微信扫一扫

内容投诉

生成图片

中国，正在批量制造AI印钞机

近日，中国开源大模型DeepSeek-R1发布，其557.6万美元的预训练成本仅为OpenAI GPT-4的十分之一，且功能不逊色，引发全球关注。DeepSeek-R1的开源特性让欧洲、印度等国家的创业者和投资人看到了进入AI领域的希望。此前，AI领域主要由中国和美国主导，其他国家难以涉足，但DeepSeek的出现打破了这一局面，推动了AI应用的快速发展。开源大模型降低了训练成本，使得AI竞争重点从训练转向推理。预计到2026年底，推理算力需求将占AI总需求的九成。中国AI应用已快速涌现，如夸克接入阿里通义千问基模，实现多种实用功能；Manus可自动分析简历；米哈游推出的AI游戏《Whispers from the Star》提供沉浸式体验。AI应用的爆发不仅带动下游产业发展，还刺激上游芯片需求，利好国产芯片崛起。未来，AI应用将进一步渗透各行各业，为中国新质生产力发展创造机遇。

原文链接

未来编码者

04-16 16:07:51

AI应用

开源大模型

推理算力

分享至

打开微信扫一扫

内容投诉

生成图片

民生证券：再次强调国产AI算力预期差下的大机遇

财联社3月9日电，民生证券计算机团队发布报告指出，随着DeepSeek等头部AI模型的发展，AI应用正加速落地，AI Agent将显著增加推理算力需求。DeepSeek对算力生态的优化有望激发国产算力潜力。国民级应用模型的使用将长期推动算力需求上升，降低AI行业门槛和成本。在大国科技竞争背景下，AI算力国产化成为必然趋势，为国产算力带来重要发展机遇。

原文链接

QuantumHacker

03-09 15:53:11

AI算力

国产算力

推理算力

分享至

打开微信扫一扫

内容投诉

生成图片

这份未来AI竞争形势分析，连马斯克也拍手叫好？一文读懂

财联社2月24日讯，美国TMT投资人Gavin Baker发布推文分析未来AI竞争趋势，获马斯克点赞。Baker认为，AI产业变革加速，OpenAI的领先优势将缩小，数据成为核心竞争力。谷歌、Meta等巨头通过垄断数据构建护城河。目前，OpenAI、Google、xAI等公司模型技术水平接近。Baker指出，‘Scaling Law’的优势窗口正在关闭，未来模型需依赖独特数据源。他认为，AI计算将转向95%的推理阶段，预训练仅占5%，强调基础设施的重要性。

原文链接

月光编码师

02-24 11:26:02

AI竞争趋势

推理算力

数据资源

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek狂潮下，九张图表详解智算市场走向

2025年，DeepSeek的兴起引发智算市场剧变，短期内算力需求激增。浪潮信息高级副总裁刘军透露，近期咨询购买AI服务器的客户数直线上升。《报告》显示，2024年中国人工智能算力市场规模达190亿美元，2025年将增至259亿美元，同比增长36.2%。DeepSeek不仅在推理端推动市场，还在预训练和后训练端带来重大影响。未来18个月，软件和服务支出将是企业生成式AI项目的主要方向。公有云和私有云市场都将因DeepSeek模型调用或部署迎来竞争。浪潮信息2月11日推出的元脑R1推理服务器受到关注，单机即可运行DeepSeek R1 671B模型。

原文链接

电子诗篇

02-20 12:10:30

DeepSeek

推理算力

智算市场

分享至

打开微信扫一扫

内容投诉

生成图片

中信证券：DeepSeek V3发布，加速AI应用落地

12月26日，DeepSeek-V3发布并开源，提升了训练效率和推理速度。该模型参数为6710亿，通识和专业知识测试表现优异，MMLU pro正确率75.9%，MATH 500正确率90.2%。相比GPT-4，DeepSeek-V3的训练成本更低，仅为GPT-4的1/6.2。DeepSeek-V3的发布有望加速AI应用落地，特别是在办公、教育、金融等领域。国产模型性价比提升，AI应用将依托丰富生态和成熟流量加速各领域落地。

原文链接

QuantumHacker

12-30 09:14:50

AI应用

DeepSeek V3

推理算力

分享至

打开微信扫一扫

内容投诉

生成图片

德邦证券：AI Agent或迎来第一轮爆发关注基础设施AI推理算力的建设及未来AI终端与AI应用的放量

2025年或成为全终端AI Agent爆发元年，德邦证券预测AI Agent网络有望初具规模，终端将率先放量，随后是全行业的广泛应用，预计AI应用的商业模式闭环也将形成。AI Agent功能的完善将提升其渗透率，带动以手机为代表的终端市场增长。目前，大模型训练端的算力需求放缓，但推理算力需求显著增加，这将促使大模型和应用厂商更加重视推理侧的落地，开发出标志性的AI应用。参照1997年互联网落地的重要时刻，建议关注基础设施中的AI推理算力建设和未来AI终端及应用的放量趋势。此信息截至2023年9月29日。

原文链接