6月23日,月之暗面(Moonshot AI)推出首款自主强化学习Agent产品Kimi-Researcher,并开启小范围灰度测试。该产品基于端到端自主强化学习技术开发,在HLE测试中表现突出,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent持平。Kimi-Researcher具备高度自主性,无需复杂提示词或预设流程,可独立完成任务规划与执行,同时有效减少幻觉问题,确保研究严谨性。其核心优势在于动态环境下的自主决策能力,包括信息权衡、任务节点切换和中间信息筛选。月之暗面计划未来逐步开源该产品的基础预训练模型及强化学习优化版本,推动相关领域发展。
原文链接
本文链接:https://kx.umi6.com/article/20626.html
转载请注明文章出处
相关推荐
.png)
换一换
图灵奖获奖者们, AI 界的「奥本海默」
2025-03-10 13:35:24
波士顿动力 Spot 四足机器人学会连续后空翻,意外让行走姿态更像真实动物
2025-08-28 10:20:06
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
2025-03-08 11:48:22
全球闲置算力训个模型,性能媲美R1,老黄“天塌了”
2025-05-16 14:29:01
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
2025-02-12 15:29:54
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
2025-04-09 21:08:08
翁荔最新万字长文:Why We Think
2025-05-18 14:20:10
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
秒级生成百万级token!九章云极发布九章智算云Alaya NeW Cloud 2.0
2025-06-16 19:13:12
传月之暗面内测内容社区新产品
2025-04-14 16:43:56
为何强化学习火遍硅谷?AGI的关键一步
2025-08-07 15:55:40
531 文章
173276 浏览
24小时热文
更多

-
2025-09-06 23:39:46
-
2025-09-06 22:39:24
-
2025-09-06 21:38:26