1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:杨植麟发布Kimi新模型:数学对标o1,中考高考研成绩全第一

在Kimi全面开放一周年之际,创始人杨植麟发布了新模型——数学模型k0-math,对标OpenAI的o1系列,主打深入思考。在MATH、中考、高考、考研四个数学基准测试中,k0-math的成绩超过o1-mini和o1-preview。

k0-math在解题过程中会详细展示思考过程,甚至在简单问题上也会反复尝试多种思路。例如,面对AIME竞赛题目,k0-math尝试了多次后才得出正确答案;而对于简单的“1+1等于几”,它会通过多种方式验证,最终得出正确答案。这反映了模型虽然强大,但在某些简单问题上仍需优化。

杨植麟认为这是一个机遇与局限并存的情况,下一阶段的迭代将逐步改进这一问题,使模型能够自动判断何时需要深入思考。发布k0-math还反映出月之暗面当前的重点是提升模型的深入思考能力和基于强化学习的Scaling Law。

同时,Kimi探索版在意图增强、信源分析和链式思考能力方面也有所提升。例如,在用户调研中,Kimi探索版能够将模糊概念具体化,通过并行搜索获取更全面和准确的答案;在信源分析方面,它能够筛选出更具权威性的信源,并提供溯源链接;在链式思考能力方面,Kimi探索版能更好地处理复杂的研究问题,如技术选型中的问题。

关于强化学习中的数据、算力、算法平衡问题,杨植麟认为AI发展是一个动态平衡的过程。目前,随着算法和数据的进步,算力不再是唯一瓶颈,关键在于获取高质量的数据。此外,他强调强化学习是未来的重要趋势,能够通过改变目标函数和学习方式,释放Scaling的潜力。

未来几周,k0-math模型和更强的Kimi探索版将陆续上线Kimi网页版和Kimi智能助手APP。用户将有更多选择,可根据需求使用不同模型,以满足多样化的需求。

原文链接
本文链接:https://kx.umi6.com/article/8835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
我不给人做产品,给Agent做
2025-06-30 08:39:41
上交博士最新思考:仅用两个问题讲清强化学习
2025-11-10 18:29:12
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
2025-07-14 17:29:16
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
2025-07-24 16:09:58
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
24小时热文
更多
扫一扫体验小程序