1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年1月16日,美团LongCat团队发布并开源全球首个支持“重思考”模式的模型LongCat-Flash-Thinking-2601。该模型在工具调用、智能体搜索等核心评测中达到开源SOTA水平,尤其在复杂任务中的泛化能力超越Claude,显著降低新工具适配成本。其创新的“重思考”模式通过并行思考和总结归纳两阶段优化推理过程,确保决策可靠。评估显示,该模型在编程(LCB评分82.8)、数学推理(AIME满分)、工具调用(τ²-Bench评分88.2)及搜索能力(BrowseComp评分73.1)等方面表现领先。此外,美团设计全新自动化任务合成流程验证模型泛化能力,实验结果优异。模型已完整开源,支持在线免费体验,并提供GitHub、Hugging Face等多个平台访问链接。

原文链接
本文链接:https://kx.umi6.com/article/31726.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包大模型1.6-vision正式发布
2025-09-30 16:34:50
豆包大模型 1.6-vision 发布:家族首个能调用工具的视觉深度思考模型
2025-10-01 15:45:42
智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%
2025-09-02 12:30:05
RAM——复杂场景下多人3D人体运动重建新框架 | CVPR 2026
2026-04-24 14:15:34
独家|黑湖科技完成近10亿元D轮融资
2026-04-23 08:59:12
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
成都出台人工智能产业人才九条 最高给予10亿元综合支持
2026-04-23 20:29:56
Deepseek官网公布deepseek-v4接口文档
2026-04-24 11:10:00
国家药监局:以“人工智能+药品监管”建设为主线 全力推进药品智慧监管建设和统计各项工作
2026-04-24 18:31:29
半壁华人!GPT Image 2团队曝光:无锡才俊带队,13人4个月封神
2026-04-23 16:14:21
多重利好催化 AI硬件开启消费电子新成长周期
2026-04-23 06:53:08
谷歌:目前谷歌所有新代码中 75%由人工智能生成
2026-04-22 20:28:17
Anthropic二级市场估值升至万亿美元 超越OpenAI
2026-04-23 14:11:46
24小时热文
更多
扫一扫体验小程序