参数 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek V4 Lite悄然更新：2000亿小参数性能逼近美国顶流

3月3日，DeepSeek V4 Lite悄然更新，参数规模仅2000亿的小模型性能逼近美国顶级大模型Sonnet 4.6。该模型自2月11日发布以来持续升级，2月27日的测试已显示显著进步，最新0302版在多项测试中表现优异，包括天气卡、游戏及前端功能等。尽管国产AI模型在对话聊天方面与闭源模型差距缩小，但在多模态、编程等领域仍落后于Anthropic、OpenAI等美国公司。DeepSeek的技术探索树立标杆，若完整版DeepSeek V4发布，或对美国AI领域造成重大冲击。

原文链接

数据炼金师

03-03 11:57:04

2000亿参数

DeepSeek V4 Lite

SOTA

分享至

打开微信扫一扫

内容投诉

生成图片

懂人性更懂执行，蚂蚁这个万亿开源模型把情商和Agent战斗力都给拉满了

标题：蚂蚁发布万亿参数开源模型Ling-2.5-1T，兼具情商与执行力蚂蚁百灵大模型家族推出全新旗舰级模型Ling-2.5-1T，拥有万亿参数，主打通用全能和高效回复。它不仅具备强大的Agent执行能力，还保留了高情商和写作能力，同时运行轻快、节约Token，生成文本长且流畅。 Ling-...

原文链接

GhostPilot

02-19 13:24:18

Ling-2.5-1T

万亿参数

情商

分享至

打开微信扫一扫

内容投诉

生成图片

全国首个3万卡AI集群上线：兼容CUDA 可支持万亿参数大模型

2月5日，中科曙光宣布全国首个3万卡AI超集群正式上线，部署于国家超算互联网郑州核心节点。该集群基于scaleX架构，兼容CUDA等主流软件生态，支持多品牌国产加速卡混合部署，并可扩展至十万卡甚至百万卡规模，满足产业规模化需求。系统已适配优化400多个主流大模型，支持万亿参数模型训练及高通量推理，广泛赋能科研与产业应用。例如，助力国内某材料研发大模型登顶国际榜单，将蛋白质研究效率提升3-6个数量级。此外，搭配OneScience平台，降低多学科交叉研究门槛，实现“算力+应用”一体化交付。这是自2025年12月HAIC大会首次亮相后，不到2个月完成的大规模算力落地。

原文链接

神经网络领航员

02-05 22:13:01

3万卡AI集群

CUDA兼容

万亿参数大模型

分享至

打开微信扫一扫

内容投诉

生成图片

中国研发人工智能地震实时监测系统将助力全球地震监测

12月27日，中国地震系统研发的人工智能地震实时监测系统（AIRES）通过专家论证。该系统融合人工智能与地震学算法，实现从波形输入到地震多参数产出的全流程自动化处理，并可无缝对接现有业务系统。示范运行显示，系统运行稳定，地震事件检测与人工目录匹配率达95.1%，分类准确率达94.7%。专家组认为其性能优异，核心技术与综合性能达国际先进水平，具备良好推广价值，将助力全球地震监测。

原文链接

元界筑梦师

12-27 21:57:42

人工智能地震实时监测系统

地震多参数产出

示范运行

分享至

打开微信扫一扫

内容投诉

生成图片

AI 参数战争下的「隐秘战场」：为何全球顶级厂商集体转向「游戏」？

2025年，AI行业在‘参数战争’之外，正悄然转向‘理解空间与物理法则’的新阶段。全球顶级厂商如OpenAI、Google DeepMind、微软等纷纷押注游戏领域，将其视为AI训练的最佳场景。腾讯等公司凭借技术和生态的双重优势，形成独特闭环，推动AI深度融入游戏玩法和制作流程。例如，《和平精英》推出AI战犬玩法，《王者荣耀》通过AI辅助降低新手门槛，同时AI工具优化了游戏开发中的渲染和动画制作。英伟达发布的NitroGen模型进一步证明，游戏训练的AI能力可迁移到现实世界。这一趋势表明，游戏不仅是娱乐媒介，更是AI进化的关键试验场，最终将为玩家带来更优质的游戏体验，并见证AI技术的持续突破。

原文链接

Nebula

12-23 15:44:34

AI进化

参数战争

游戏训练场

分享至

打开微信扫一扫

内容投诉

生成图片

中科曙光发布scaleX万卡超集群

12月18日，在光合组织2025人工智能创新大会上，中科曙光正式发布scaleX万卡超集群。该系统由多个scaleX640超节点组成，具备5EFlops总算力和超过650TB的HBM总容量，专为万亿参数大模型及科学智能场景设计。这一发布标志着高性能计算领域的重要进展，展现了国产技术在人工智能与科学计算结合中的强大实力。（记者陈俊清）

原文链接

像素宇宙

12-18 12:44:59

scaleX万卡超集群

万亿参数大模型

中科曙光

分享至

打开微信扫一扫

内容投诉

生成图片

AI Coding分水岭：狂卷参数的背后，生态标准之战才刚开始

AI Coding正成为人工智能商业化落地最快的赛道，据预测，其市场将从2025年的151.1亿美元增长至2034年的991亿美元。微软CEO纳德拉透露，微软30%的代码已由AI生成，预计到2030年这一比例将达到95%。中国市场同样潜力巨大，2024年前三季度软件业务收入达98281亿元，同比增长10.8%。中美在AI编程领域采取不同路线：美国以闭源性能取胜，如Anthropic推出的Claude Opus 4.5在SWE-Bench测试中突破80.9%，而中国则走开源+性价比路线，DeepSeek-V3.2等模型性能逼近国际顶尖水平。此外，生态标准竞争逐渐升温，美国厂商通过工具链和协议（如A2A、MCP）抢占先机，而中国厂商如阿里Qwen Code正加速追赶。未来关键在于B端标准制定权，参数提升虽快，但生态成熟需长期积累。

原文链接

E-Poet

12-09 16:49:08

AI Coding

参数性能

生态标准

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

11月20日，蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架基于其自研技术，能够在数千卡GPU集群上实现5-10秒内完成万亿参数级别的权重同步。今年10月，蚂蚁集团已开源两款旗舰模型：非思考模型Ling-1T和思考模型Ring-1T，其中Ring-1T正是依托Awex框架开发。这一开源项目为大规模人工智能模型训练提供了重要技术支持，进一步推动了高性能计算与强化学习领域的发展。

原文链接

WisdomTrail

11-20 10:23:09

Awex框架

万亿参数

蚂蚁集团

分享至

打开微信扫一扫

内容投诉

生成图片

百度李彦宏发布文心大模型 5.0：参数规模超 2.4 万亿，原生全模态

11月13日，在2025百度世界大会上，百度创始人李彦宏正式发布文心大模型5.0。该模型参数规模超2.4万亿，采用自回归统一架构和超稀疏混合专家架构，是新一代原生全模态大模型，支持理解与生成一体化。文心大模型5.0在全模态理解、创意写作、智能体规划、指令遵循等方面表现优异，尤其在语言、视觉理解、音频理解及视觉生成等测试中表现突出。百度现场演示了其在视频理解、视频生成（如《甄嬛传》片段二创）以及代码编写方面的能力，并表示模型持续学习进化中。目前，文心大模型5.0已上线百度千帆平台，用户可登录调用。

原文链接

梦境编程师

11-13 12:00:45

全模态

参数规模

文心大模型5.0

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁发布并开源万亿参数思考模型Ring-1T

10月14日，蚂蚁集团发布并开源了万亿参数思考模型Ring-1T，同时公开模型权重与训练配方。该模型在9月30日开源的预览版Ring-1T-preview基础上，进一步扩展了大规模可验证奖励强化学习（RLVR）训练，显著提升自然语言推理能力，并通过RLHF训练优化通用能力，在多项任务榜单中表现更加均衡。这一进展展示了蚂蚁在大模型领域的技术实力，也为行业提供了重要开源资源。

原文链接