1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:杨植麟发布Kimi新模型:数学对标o1,中考高考研成绩全第一

在Kimi全面开放一周年之际,创始人杨植麟发布了新模型——数学模型k0-math,对标OpenAI的o1系列,主打深入思考。在MATH、中考、高考、考研四个数学基准测试中,k0-math的成绩超过o1-mini和o1-preview。

k0-math在解题过程中会详细展示思考过程,甚至在简单问题上也会反复尝试多种思路。例如,面对AIME竞赛题目,k0-math尝试了多次后才得出正确答案;而对于简单的“1+1等于几”,它会通过多种方式验证,最终得出正确答案。这反映了模型虽然强大,但在某些简单问题上仍需优化。

杨植麟认为这是一个机遇与局限并存的情况,下一阶段的迭代将逐步改进这一问题,使模型能够自动判断何时需要深入思考。发布k0-math还反映出月之暗面当前的重点是提升模型的深入思考能力和基于强化学习的Scaling Law。

同时,Kimi探索版在意图增强、信源分析和链式思考能力方面也有所提升。例如,在用户调研中,Kimi探索版能够将模糊概念具体化,通过并行搜索获取更全面和准确的答案;在信源分析方面,它能够筛选出更具权威性的信源,并提供溯源链接;在链式思考能力方面,Kimi探索版能更好地处理复杂的研究问题,如技术选型中的问题。

关于强化学习中的数据、算力、算法平衡问题,杨植麟认为AI发展是一个动态平衡的过程。目前,随着算法和数据的进步,算力不再是唯一瓶颈,关键在于获取高质量的数据。此外,他强调强化学习是未来的重要趋势,能够通过改变目标函数和学习方式,释放Scaling的潜力。

未来几周,k0-math模型和更强的Kimi探索版将陆续上线Kimi网页版和Kimi智能助手APP。用户将有更多选择,可根据需求使用不同模型,以满足多样化的需求。

原文链接
本文链接:https://kx.umi6.com/article/8835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
我不给人做产品,给Agent做
2025-06-30 08:39:41
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
2025-11-08 13:43:06
蚂蚁集团开源 Awex 框架,秒级完成 TB 级参数交换
2025-11-20 10:17:17
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
24小时热文
更多
扫一扫体验小程序