1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:杨植麟发布Kimi新模型:数学对标o1,中考高考研成绩全第一

在Kimi全面开放一周年之际,创始人杨植麟发布了新模型——数学模型k0-math,对标OpenAI的o1系列,主打深入思考。在MATH、中考、高考、考研四个数学基准测试中,k0-math的成绩超过o1-mini和o1-preview。

k0-math在解题过程中会详细展示思考过程,甚至在简单问题上也会反复尝试多种思路。例如,面对AIME竞赛题目,k0-math尝试了多次后才得出正确答案;而对于简单的“1+1等于几”,它会通过多种方式验证,最终得出正确答案。这反映了模型虽然强大,但在某些简单问题上仍需优化。

杨植麟认为这是一个机遇与局限并存的情况,下一阶段的迭代将逐步改进这一问题,使模型能够自动判断何时需要深入思考。发布k0-math还反映出月之暗面当前的重点是提升模型的深入思考能力和基于强化学习的Scaling Law。

同时,Kimi探索版在意图增强、信源分析和链式思考能力方面也有所提升。例如,在用户调研中,Kimi探索版能够将模糊概念具体化,通过并行搜索获取更全面和准确的答案;在信源分析方面,它能够筛选出更具权威性的信源,并提供溯源链接;在链式思考能力方面,Kimi探索版能更好地处理复杂的研究问题,如技术选型中的问题。

关于强化学习中的数据、算力、算法平衡问题,杨植麟认为AI发展是一个动态平衡的过程。目前,随着算法和数据的进步,算力不再是唯一瓶颈,关键在于获取高质量的数据。此外,他强调强化学习是未来的重要趋势,能够通过改变目标函数和学习方式,释放Scaling的潜力。

未来几周,k0-math模型和更强的Kimi探索版将陆续上线Kimi网页版和Kimi智能助手APP。用户将有更多选择,可根据需求使用不同模型,以满足多样化的需求。

原文链接
本文链接:https://kx.umi6.com/article/8835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI:GPT-5 模型正开始减轻科学家日常工作量
2025-11-22 00:51:13
Meta 推出强化学习新框架 SWEET-RL,让 AI 更懂人类意图
2025-03-24 11:54:11
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架
2025-05-17 13:06:23
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
Gemini2.5弯道超车背后的灵魂人物
2025-06-05 11:52:48
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
秒级生成百万级token!九章云极发布九章智算云Alaya NeW Cloud 2.0
2025-06-16 19:13:12
4o-mini华人领队也离职了,这次不怪小扎
2025-08-19 16:01:05
上交博士最新思考:仅用两个问题讲清强化学习
2025-11-10 18:29:12
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
2025-03-20 19:41:21
24小时热文
更多
扫一扫体验小程序