6月23日,月之暗面(Moonshot AI)推出首款自主强化学习Agent产品Kimi-Researcher,并开启小范围灰度测试。该产品基于端到端自主强化学习技术开发,在HLE测试中表现突出,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent持平。Kimi-Researcher具备高度自主性,无需复杂提示词或预设流程,可独立完成任务规划与执行,同时有效减少幻觉问题,确保研究严谨性。其核心优势在于动态环境下的自主决策能力,包括信息权衡、任务节点切换和中间信息筛选。月之暗面计划未来逐步开源该产品的基础预训练模型及强化学习优化版本,推动相关领域发展。
原文链接
本文链接:https://kx.umi6.com/article/20626.html
转载请注明文章出处
相关推荐
.png)
换一换
月之暗面回应Kimi K2模型API速度慢:正在解决中 也在加卡加机器
2025-07-15 19:48:46
上海 AI 实验室联合清华等大学突破强化学习算法,攻克 AI 推理熵崩溃难题
2025-06-04 08:15:30
从“卖API”到“卖解决方案” 月之暗面Kimi押注Agent|聚焦
2025-06-26 08:39:13
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
秒级生成百万级token!九章云极发布九章智算云Alaya NeW Cloud 2.0
2025-06-16 19:13:12
月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API
2025-09-05 12:17:23
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
2025-08-01 15:06:32
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
马斯克亲自点名Karpathy迎战Grok 5!别神话LLM,AGI还要等十年
2025-10-20 15:08:42
588 文章
268397 浏览
24小时热文
更多

-
2025-10-23 11:04:07
-
2025-10-23 11:03:14
-
2025-10-23 11:03:01