2026年1月,陈天桥与代季峰携手发布开源大模型MiroThinker 1.5,参数仅30B却跑出媲美1T性能,成为智能体模型领域新标杆。在多项基准测试中,其表现超越GPT-5-High、Gemini-3-Pro等顶尖模型,尤其BrowseComp测试刷新全球纪录。相比Kimi-K2-Thinking,MiroThinker 1.5在性能提升4.5%的同时,推理成本降至$0.07,仅为前者的1/20。该模型通过“推理-验证-修正”循环机制,降低对参数规模依赖,强化外部交互能力,显著提升智效比。实测显示其在体育赛事预测、股市分析等复杂场景中表现出色,逻辑严谨且响应快速。MiroMind团队通过Interactive Scaling创新方法论,将模型训练为注重求证与自我修正的探索型Agent,率先实现以小搏大的技术突破。项目已全面开源,代码及模型可通过GitHub和Hugging Face获取。
原文链接
本文链接:https://kx.umi6.com/article/31188.html
转载请注明文章出处
相关推荐
换一换
DeepSeek甩出了一张“王炸”
2024-12-28 15:30:07
赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代
2024-07-24 09:14:59
登顶开源大模型榜首 阿里Qwen3成色如何?|聚焦
2025-05-01 20:35:17
OpenAI重返开源大模型赛道,谈一谈我关注的一些要点
2025-08-06 15:38:28
OpenAI反对美国SB-1047法案,会杀死开源大模型!
2024-08-23 12:53:38
医疗复杂推理开源大模型——华佗GPT-o1
2025-01-15 14:30:58
独家| 陈天桥“All in AI”新动向:正筹备一家创业公司 国内大牛代季峰加盟
2025-08-06 21:38:53
AI大佬锐评开源大模型:DS/Qwen/Kimi并列第一 硅谷巨头拉完了
2025-12-15 22:03:31
印度开源大模型上线两天仅300余次下载
2025-05-27 17:22:55
陈天桥与《科学》杂志联手,3万美元悬赏AI驱动科学研究,获奖论文发Science
2024-08-27 09:46:00
DeepSeek超越150万模型:成全球最受欢迎开源大模型
2025-02-24 08:18:12
阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一
2024-06-14 18:26:37
吴恩达:美国加州SB-1047法案,将扼杀开源大模型
2024-06-18 12:20:10
635 文章
403590 浏览
24小时热文
更多
-
2026-01-08 01:43:53 -
2026-01-07 22:33:42 -
2026-01-07 22:33:31