正文:2025年9月1日,美团发布并开源了LongCat-Flash-Chat AI模型,采用混合专家架构,总参数量达5600亿,但仅激活5%即可实现高效性能。该模型在智能体任务、推理速度及成本控制上表现突出,尤其适合复杂场景应用。其创新的“零计算专家”机制和跨层通道设计优化了算力分配与训练效率,在H800 GPU上实现100+ tokens/s推理速度,输出成本低至5元/百万token。基准测试中,LongCat-Flash在多项指标中名列前茅,例如ArenaHard-V2得分86.50,MMLU得分89.71,并在智能体工具使用和编程任务中超越更大规模模型。美团已提供SGLang和vLLM两种部署方案,代码以MIT License开源,用户可自由用于研究或蒸馏新模型。详情见其官方资源及相关页面。
原文链接
本文链接:https://kx.umi6.com/article/24522.html
转载请注明文章出处
相关推荐
换一换
美团终于上线了AI外卖助手
2024-06-07 21:27:04
美团高管自曝:正研发我发起的NativeAI产品 但不是我带队
2025-03-24 19:13:47
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
王慧文,盯上AI应用
2024-11-08 19:30:01
一文详解:DeepSeek刚开源的DeepGEMM是怎么回事?
2025-02-26 14:36:20
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
美团CEO王兴:将继续加大投资开发大语言模型
2025-05-26 21:54:46
王兴披露美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平,6 月将推业务决策助手
2025-05-26 21:50:33
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
美团王兴,中国具身智能第一投资人
2025-07-14 10:16:02
美团新独立APP,点不了菜只能点AI
2025-11-03 12:17:52
王兴首次谈AI:美团策略是进攻而非防守,今年将推AI生活助手
2025-03-22 12:15:52
687 文章
493530 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22