1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:杨植麟发布Kimi新模型:数学对标o1,中考高考研成绩全第一

在Kimi全面开放一周年之际,创始人杨植麟发布了新模型——数学模型k0-math,对标OpenAI的o1系列,主打深入思考。在MATH、中考、高考、考研四个数学基准测试中,k0-math的成绩超过o1-mini和o1-preview。

k0-math在解题过程中会详细展示思考过程,甚至在简单问题上也会反复尝试多种思路。例如,面对AIME竞赛题目,k0-math尝试了多次后才得出正确答案;而对于简单的“1+1等于几”,它会通过多种方式验证,最终得出正确答案。这反映了模型虽然强大,但在某些简单问题上仍需优化。

杨植麟认为这是一个机遇与局限并存的情况,下一阶段的迭代将逐步改进这一问题,使模型能够自动判断何时需要深入思考。发布k0-math还反映出月之暗面当前的重点是提升模型的深入思考能力和基于强化学习的Scaling Law。

同时,Kimi探索版在意图增强、信源分析和链式思考能力方面也有所提升。例如,在用户调研中,Kimi探索版能够将模糊概念具体化,通过并行搜索获取更全面和准确的答案;在信源分析方面,它能够筛选出更具权威性的信源,并提供溯源链接;在链式思考能力方面,Kimi探索版能更好地处理复杂的研究问题,如技术选型中的问题。

关于强化学习中的数据、算力、算法平衡问题,杨植麟认为AI发展是一个动态平衡的过程。目前,随着算法和数据的进步,算力不再是唯一瓶颈,关键在于获取高质量的数据。此外,他强调强化学习是未来的重要趋势,能够通过改变目标函数和学习方式,释放Scaling的潜力。

未来几周,k0-math模型和更强的Kimi探索版将陆续上线Kimi网页版和Kimi智能助手APP。用户将有更多选择,可根据需求使用不同模型,以满足多样化的需求。

原文链接
本文链接:https://kx.umi6.com/article/8835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现
2025-05-29 14:32:01
大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
2025-04-02 17:34:52
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
24小时热文
更多
扫一扫体验小程序