9月1日,美团正式发布并开源大模型LongCat-Flash-Chat,总参数达560B,激活参数18.6B~31.3B(平均27B),基于混合专家架构优化计算效率与性能。该模型引入“零计算专家”机制和跨层通道设计,推理速度在H800上超100 tokens/s,成本低至5元/百万token。其智能体任务表现突出,多项基准测试中名列前茅,如ArenaHard-V2得分为86.50,MMLU达89.71,CEval达90.44,并在复杂场景工具使用和指令遵循方面领先行业。目前,模型已在Github、Hugging Face及体验官网同步开源。
原文链接
本文链接:https://kx.umi6.com/article/24512.html
转载请注明文章出处
相关推荐
.png)
换一换
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
如何避免成为AI墓地的一员?
2025-07-23 13:50:51
大模型激战正酣!大厂节前、节中进展不停 争夺下一代操作系统主导权
2025-10-05 18:23:27
我国大模型数量居全球首位,达到 1509 个、占比达 40%
2025-07-27 13:57:47
美团发布并开源混合专家模型:5600亿参数 只激活5%就有奇效
2025-09-01 13:18:39
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
中信建投武超则:大模型的迭代永无止境 坚定看好接下来AI应用的发展表现
2025-07-16 18:10:08
539 文章
279333 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29