9月1日,美团正式发布并开源大模型LongCat-Flash-Chat,总参数达560B,激活参数18.6B~31.3B(平均27B),基于混合专家架构优化计算效率与性能。该模型引入“零计算专家”机制和跨层通道设计,推理速度在H800上超100 tokens/s,成本低至5元/百万token。其智能体任务表现突出,多项基准测试中名列前茅,如ArenaHard-V2得分为86.50,MMLU达89.71,CEval达90.44,并在复杂场景工具使用和指令遵循方面领先行业。目前,模型已在Github、Hugging Face及体验官网同步开源。
原文链接
本文链接:https://kx.umi6.com/article/24512.html
转载请注明文章出处
相关推荐
换一换
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
美团发布首款AI Agent产品“小美”App
2025-09-12 10:12:46
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
阿里字节腾讯,集体重仓新风口
2025-10-17 14:18:54
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
美团视频生成模型来了!一出手就是开源SOTA
2025-10-27 16:06:12
589 文章
372259 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30