1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:杨植麟发布Kimi新模型:数学对标o1,中考高考研成绩全第一

在Kimi全面开放一周年之际,创始人杨植麟发布了新模型——数学模型k0-math,对标OpenAI的o1系列,主打深入思考。在MATH、中考、高考、考研四个数学基准测试中,k0-math的成绩超过o1-mini和o1-preview。

k0-math在解题过程中会详细展示思考过程,甚至在简单问题上也会反复尝试多种思路。例如,面对AIME竞赛题目,k0-math尝试了多次后才得出正确答案;而对于简单的“1+1等于几”,它会通过多种方式验证,最终得出正确答案。这反映了模型虽然强大,但在某些简单问题上仍需优化。

杨植麟认为这是一个机遇与局限并存的情况,下一阶段的迭代将逐步改进这一问题,使模型能够自动判断何时需要深入思考。发布k0-math还反映出月之暗面当前的重点是提升模型的深入思考能力和基于强化学习的Scaling Law。

同时,Kimi探索版在意图增强、信源分析和链式思考能力方面也有所提升。例如,在用户调研中,Kimi探索版能够将模糊概念具体化,通过并行搜索获取更全面和准确的答案;在信源分析方面,它能够筛选出更具权威性的信源,并提供溯源链接;在链式思考能力方面,Kimi探索版能更好地处理复杂的研究问题,如技术选型中的问题。

关于强化学习中的数据、算力、算法平衡问题,杨植麟认为AI发展是一个动态平衡的过程。目前,随着算法和数据的进步,算力不再是唯一瓶颈,关键在于获取高质量的数据。此外,他强调强化学习是未来的重要趋势,能够通过改变目标函数和学习方式,释放Scaling的潜力。

未来几周,k0-math模型和更强的Kimi探索版将陆续上线Kimi网页版和Kimi智能助手APP。用户将有更多选择,可根据需求使用不同模型,以满足多样化的需求。

原文链接
本文链接:https://kx.umi6.com/article/8835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现
2025-05-29 14:32:01
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
OpenAI早期员工David Luan最新访谈:DeepSeek并未改变AI技术的叙事
2025-02-26 09:24:20
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
2025-01-29 20:14:38
大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
2025-02-06 16:33:21
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
2025-07-24 16:09:58
TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview
2025-01-26 17:15:51
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025-02-27 15:32:45
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
Meta 推出强化学习新框架 SWEET-RL,让 AI 更懂人类意图
2025-03-24 11:54:11
24小时热文
更多
扫一扫体验小程序