1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年1月16日,美团LongCat团队发布并开源全球首个支持“重思考”模式的模型LongCat-Flash-Thinking-2601。该模型在工具调用、智能体搜索等核心评测中达到开源SOTA水平,尤其在复杂任务中的泛化能力超越Claude,显著降低新工具适配成本。其创新的“重思考”模式通过并行思考和总结归纳两阶段优化推理过程,确保决策可靠。评估显示,该模型在编程(LCB评分82.8)、数学推理(AIME满分)、工具调用(τ²-Bench评分88.2)及搜索能力(BrowseComp评分73.1)等方面表现领先。此外,美团设计全新自动化任务合成流程验证模型泛化能力,实验结果优异。模型已完整开源,支持在线免费体验,并提供GitHub、Hugging Face等多个平台访问链接。

原文链接
本文链接:https://kx.umi6.com/article/31726.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包大模型1.6-vision正式发布
2025-09-30 16:34:50
智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%
2025-09-02 12:30:05
豆包大模型 1.6-vision 发布:家族首个能调用工具的视觉深度思考模型
2025-10-01 15:45:42
全球首个开源“重思考”模型:美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA
2026-01-16 14:36:37
维基百科与微软、Meta等科技巨头签署AI内容训练协议
2026-01-15 20:57:16
星动纪元与顺丰科技签约,推动具身智能机器人在供应链落地
2026-01-15 17:47:44
台积电魏哲家:需要充足的电力 扩产才能不受限制
2026-01-16 13:36:05
国家档案局:“十五五”时期 全国档案系统要持续拓展民生档案覆盖领域
2026-01-15 20:58:22
上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」
2026-01-16 15:56:29
AMD Software: Adrenalin Edition AI Bundle 软件包将于 1 月 21 日上线
2026-01-15 12:32:54
阿里千问 App 上线“千问小讲堂”:整页作业秒判、真人老师免费讲题
2026-01-15 12:34:00
谷歌DeepMind CEO:中国的AI模型仅落后美国几个月
2026-01-16 15:53:46
OpenAI 与晶圆级 AI 芯片企业 Cerebras 达成合作,三年部署 750MW 推理系统
2026-01-15 10:26:49
24小时热文
更多
扫一扫体验小程序