6月20日,Kimi的第一个Agent模型Kimi-Researcher开启小范围灰度测试。该模型基于端到端自主强化学习技术,专为深度研究任务设计。它能自主规划任务流程,平均进行23步推理,搜索74个关键词,筛选出信息质量最高的3.2%内容,生成超万字的易追溯研究报告。报告平均引用26个高质量信源,支持点击跳转验证。此外,还提供动态可视化报告,便于快速掌握核心结论。在HLE基准测试中,Kimi-Researcher Pass@1准确率达26.9%,与Gemini-Pro Deep Research Agent持平,为已知最高水平之一。在xbench DeepSearch任务中,其平均通过率达69%,表现突出。
原文链接
本文链接:https://kx.umi6.com/article/20577.html
转载请注明文章出处
相关推荐
换一换
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
MiniMaxM2.5模型即将正式上线
2026-02-12 14:28:24
从“卖API”到“卖解决方案” 月之暗面Kimi押注Agent|聚焦
2025-06-26 08:39:13
快手可灵AI申请内测人数超50万
2024-07-06 13:45:52
MiniMax开启Agent内测
2025-05-16 17:39:21
如何加入理想汽车内测:AI理想同学首次公开解答
2024-09-10 19:39:40
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
2025-06-21 09:08:37
全球SOTA编程模型MiniMax M2.5上线
2026-02-12 14:30:28
深圳:开展智能网联汽车“车路云一体化”应用试点 加大“智造+智驾”汽车全产业链AI赋能力度
2026-02-12 19:42:39
华泰证券:字节seedance2.0出圈,AI视频迎工业化奇点,看好三大方向
2026-02-12 08:10:02
小米的首代机器人VLA大模型来了!丝滑赛德芙,推理延迟仅80ms丨全面开源
2026-02-12 21:45:01
软银集团4-12月净利润增至5倍 创历史同期新高
2026-02-12 16:32:10
边问边买 谷歌将AI购物功能嵌入搜索与Gemini
2026-02-12 00:52:03
781 文章
520436 浏览
24小时热文
更多
-
2026-02-13 02:57:22 -
2026-02-13 01:54:05 -
2026-02-12 23:49:34