9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,综合性能达全球开源模型最先进水平(SOTA)。该模型在逻辑、数学、代码及智能体任务中表现卓越,是国内首个结合“深度思考+工具调用”与“非形式化+形式化”推理能力的语言模型。通过创新架构如领域并行强化学习和异步弹性共卡系统,模型实现高效推理与稳定训练,在复杂任务中显著优化资源利用。多项权威评测显示,其在ARC-AGI、HMMT、LiveCodeBench等基准测试中刷新纪录,超越OpenAI o3、Gemini2.5 Pro等顶尖模型。项目已开源,地址包括Hugging Face与Github。
原文链接
本文链接:https://kx.umi6.com/article/25638.html
转载请注明文章出处
相关推荐
换一换
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
阿里云通义发布首个多模态推理模型QVQ
2024-12-25 13:05:41
关于DeepSeek的误读与真相
2025-02-14 10:33:32
网易有道推出轻量级推理模型“子曰-o1”,更小规模实现更强推理效果
2025-01-22 12:54:57
阿里自研“深度思考”推理模型已上线夸克 AI 搜索,后续将有更强模型上线
2025-03-01 15:00:52
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
分割/识别/解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配
2025-06-14 20:40:35
最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
2025-04-13 21:56:24
那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线
2026-01-27 00:41:43
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
2025-05-30 11:50:26
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
2025-08-06 11:26:58
国产六大推理模型激战OpenAI?
2025-04-25 10:03:41
788 文章
547911 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18