1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年1月16日,美团LongCat团队发布并开源全球首个支持“重思考”模式的模型LongCat-Flash-Thinking-2601。该模型在工具调用、智能体搜索等核心评测中达到开源SOTA水平,尤其在复杂任务中的泛化能力超越Claude,显著降低新工具适配成本。其创新的“重思考”模式通过并行思考和总结归纳两阶段优化推理过程,确保决策可靠。评估显示,该模型在编程(LCB评分82.8)、数学推理(AIME满分)、工具调用(τ²-Bench评分88.2)及搜索能力(BrowseComp评分73.1)等方面表现领先。此外,美团设计全新自动化任务合成流程验证模型泛化能力,实验结果优异。模型已完整开源,支持在线免费体验,并提供GitHub、Hugging Face等多个平台访问链接。

原文链接
本文链接:https://kx.umi6.com/article/31726.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包大模型1.6-vision正式发布
2025-09-30 16:34:50
豆包大模型 1.6-vision 发布:家族首个能调用工具的视觉深度思考模型
2025-10-01 15:45:42
智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%
2025-09-02 12:30:05
全球首个开源“重思考”模型:美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA
2026-01-16 14:36:37
美以伊冲突社媒充斥大量AI图像 画面真假难辨
2026-03-06 20:34:53
阿里否认大模型团队集体离职:团队稳定 服务正常
2026-03-05 21:58:59
Anthropic研究员:AI对就业市场的冲击尚处早期
2026-03-08 18:29:49
AI将胜任80%岗位!亿万富翁:如今5岁儿童成年后将无需再为生存而工作
2026-03-06 15:12:02
全网刷屏的“龙虾” 真的劝你不要盲目跟风!
2026-03-09 15:51:25
中国信通院:截至2025年6月我国计算设备智能算力规模达到782 EFlops 同比增长96%
2026-03-06 14:07:35
鹅厂门口爆满了!腾讯工程师在总部楼下免费安装OpenClaw
2026-03-06 15:12:11
美国拟将AI芯片出口管制扩展至全球 英伟达、AMD等公司出口需获许可
2026-03-06 06:31:53
国产AI短剧《霍去病》火到海外 播放量超5亿!3000元成本、3人团队5天产出80集
2026-03-06 17:20:41
24小时热文
更多
扫一扫体验小程序