近日,美团正式发布1.6万亿参数的LongCat-2.0大模型。该模型采用自研MoE架构,原生支持1M超长上下文,是全球首个在国产算力上实现全链路训推闭环的万亿模型,从训练到推理“英伟达含量为0”,依托5万张国产卡集群成功落地。技术上,其首创LongCat稀疏注意力等架构,大幅提升处理效率并降低成本。此前,其匿名版“Owl Alpha”已在OpenRouter平台经受住真实流量考验,成为海外开发者首选。这不仅证明国产算力已具备支撑先进大模型持续迭代的能力,更为美团建设物理世界AI底座奠定坚实基础。
原文链接
本文链接:https://kx.umi6.com/article/36806.html
转载请注明文章出处
相关推荐
换一换
科大讯飞刘庆峰:中美AI,差距多大?
2025-07-03 16:26:18
国内数学最强!实测讯飞版o1:上能打奥赛卷高考,下能辅导寒假作业
2025-01-15 21:40:59
民生证券:再次强调国产AI算力预期差下的大机遇
2025-03-09 15:53:11
龙芯中科与百度文心系列模型开展深度技术合作
2025-07-02 17:09:24
满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航
2025-02-11 15:53:01
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
英伟达H20不让用?全国产算力推理模型升级,4张华为卡即可部署
2025-04-22 15:20:45
中信证券:国产算力建设提速 超节点驱动网络侧高速成长
2025-12-01 08:58:04
国产算力出海元年开启
2025-08-01 09:56:58
清华系团队给大模型织了一张“智能算力电网”
2026-05-29 11:00:02
国产算力正在进入Token标准化时代
2026-06-18 10:20:37
华泰证券:DeepSeek-V3.1发布 国产算力链迎来高景气
2025-08-26 08:41:47
百万一台,DeepSeek带火一门新生意
2025-03-03 19:35:44
743 文章
758403 浏览
24小时热文
更多
-
2026-07-02 20:19:28 -
2026-07-02 20:17:31 -
2026-07-02 19:24:46