1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月23日,月之暗面(Moonshot AI)推出首款自主强化学习Agent产品Kimi-Researcher,并开启小范围灰度测试。该产品基于端到端自主强化学习技术开发,在HLE测试中表现突出,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,与Gemini-Pro的Deep Research Agent持平。Kimi-Researcher具备高度自主性,无需复杂提示词或预设流程,可独立完成任务规划与执行,同时有效减少幻觉问题,确保研究严谨性。其核心优势在于动态环境下的自主决策能力,包括信息权衡、任务节点切换和中间信息筛选。月之暗面计划未来逐步开源该产品的基础预训练模型及强化学习优化版本,推动相关领域发展。

原文链接
本文链接:https://kx.umi6.com/article/20626.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
上交博士最新思考:仅用两个问题讲清强化学习
2025-11-10 18:29:12
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
Kimi布局AI+医疗
2025-05-13 14:58:34
Gemini2.5弯道超车背后的灵魂人物
2025-06-05 11:52:48
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
我不给人做产品,给Agent做
2025-06-30 08:39:41
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
24小时热文
更多
扫一扫体验小程序