1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,综合性能达全球开源模型最先进水平(SOTA)。该模型在逻辑、数学、代码及智能体任务中表现卓越,是国内首个结合“深度思考+工具调用”与“非形式化+形式化”推理能力的语言模型。通过创新架构如领域并行强化学习和异步弹性共卡系统,模型实现高效推理与稳定训练,在复杂任务中显著优化资源利用。多项权威评测显示,其在ARC-AGI、HMMT、LiveCodeBench等基准测试中刷新纪录,超越OpenAI o3、Gemini2.5 Pro等顶尖模型。项目已开源,地址包括Hugging Face与Github。

原文链接
本文链接:https://kx.umi6.com/article/25638.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4o攻破ARC-AGI无法被挑战的神话,71%准确率成新SOTA
2024-06-20 14:13:43
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
直逼 DeepSeek-R1-32B,UC 伯克利等开源全新 SOTA 推理模型 OpenThinker-32B
2025-02-13 17:19:50
OpenAI两大推理模型,要把Agent吞进模型里了
2025-04-17 12:36:09
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
2025-06-09 20:34:34
2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线
2024-12-31 18:45:44
一文看懂OpenAI最强模型o1:怎么用好,为何翻车?
2024-09-20 18:22:13
OpenAI的推理模型有时会用中文“思考” 背后原因众说纷纭
2025-01-15 04:22:06
MiniMax正暗戳戳憋大招
2025-06-02 07:30:05
英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理
2025-07-20 20:07:36
免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
2024-12-23 10:51:33
网易有道推出推理模型“子曰-o1”并开源 支持消费级显卡
2025-01-22 10:57:36
24小时热文
更多
扫一扫体验小程序