9月1日,美团正式发布并开源大模型LongCat-Flash-Chat,总参数达560B,激活参数18.6B~31.3B(平均27B),基于混合专家架构优化计算效率与性能。该模型引入“零计算专家”机制和跨层通道设计,推理速度在H800上超100 tokens/s,成本低至5元/百万token。其智能体任务表现突出,多项基准测试中名列前茅,如ArenaHard-V2得分为86.50,MMLU达89.71,CEval达90.44,并在复杂场景工具使用和指令遵循方面领先行业。目前,模型已在Github、Hugging Face及体验官网同步开源。
原文链接
本文链接:https://kx.umi6.com/article/24512.html
转载请注明文章出处
相关推荐
.png)
换一换
阿里云副总裁叶杰平:大模型已呈现“周级迭代”爆发态势
2025-07-27 13:59:57
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
对话中国信通院魏凯:AI下半场,大模型要少说话,多做事
2025-07-01 08:51:07
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
2025-07-28 09:07:15
毕马威报告:中国银行业在大模型落地应用方面走在前列
2025-06-23 16:27:32
大模型低调出展,机器人各出奇招
2025-07-26 22:49:04
大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」
2025-06-20 18:02:43
我国大模型数量居全球首位
2025-07-27 13:58:52
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
WAIC 2025倒计时30天!40+大模型、50+AI终端、60+智能机器人即将重磅登场
2025-06-26 17:24:23
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
491 文章
166515 浏览
24小时热文
更多

-
2025-09-03 12:45:43
-
2025-09-03 12:44:37
-
2025-09-03 11:44:20