6月20日,Kimi的第一个Agent模型Kimi-Researcher开启小范围灰度测试。该模型基于端到端自主强化学习技术,专为深度研究任务设计。它能自主规划任务流程,平均进行23步推理,搜索74个关键词,筛选出信息质量最高的3.2%内容,生成超万字的易追溯研究报告。报告平均引用26个高质量信源,支持点击跳转验证。此外,还提供动态可视化报告,便于快速掌握核心结论。在HLE基准测试中,Kimi-Researcher Pass@1准确率达26.9%,与Gemini-Pro Deep Research Agent持平,为已知最高水平之一。在xbench DeepSearch任务中,其平均通过率达69%,表现突出。
原文链接
本文链接:https://kx.umi6.com/article/20577.html
转载请注明文章出处
相关推荐
.png)
换一换
MiniMax开启Agent内测
2025-05-16 17:39:21
快手可灵AI申请内测人数超50万
2024-07-06 13:45:52
如何加入理想汽车内测:AI理想同学首次公开解答
2024-09-10 19:39:40
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
从“卖API”到“卖解决方案” 月之暗面Kimi押注Agent|聚焦
2025-06-26 08:39:13
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
2025-06-21 09:08:37
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
2025-10-22 17:50:16
两部门:启动2025年度智能制造系统解决方案“揭榜挂帅”项目申报工作
2025-10-22 16:50:23
阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道,拿下六项冠军
2025-10-23 15:07:52
存储芯片“超级周期”持续演绎:三星、SK海力士料将涨价30% 客户开启囤货模式
2025-10-23 15:11:46
字节Seed团队推出3D生成大模型Seed3D 1.0
2025-10-23 16:12:12
Grok逼着维基百科站上擂台
2025-10-22 14:47:10
阿里通义 Qwen3-VL 新增 2B、32B 两个密集模型尺寸,手机也能跑
2025-10-22 14:45:02
655 文章
305907 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20