12月16日,月之暗面Kimi发布了视觉思考模型k1,该模型基于强化学习技术,支持端到端图像理解和思维链技术,并在数学、物理、化学等基础科学领域的基准测试中超过OpenAI o1、GPT-4o及Claude 3.5 Sonnet。Kimi新模型已上线最新版“Kimi智能助手”APP及网页版Kimi+页面,用户可通过拍照或上传图片体验完整的推理过程。k1模型的训练分为两阶段,首先通过预训练得到基础模型,然后进行强化学习后训练,其字符识别能力在多项基准测试中表现优异。此外,Kimi模型研发团队自主构建了Science Vista测试集,涵盖不同难度的数理化图片题目,将开放给全行业使用。尽管如此,k1模型在分布外泛化、复杂问题成功率及多轮问答效果等方面仍需改进。
原文链接
本文链接:https://kx.umi6.com/article/10247.html
转载请注明文章出处
相关推荐
换一换
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
清华刘知远团队论文:在严格可控环境下重新回答「强化学习能否教会大模型新能力」丨ICLR 2026
2026-02-09 19:27:01
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现
2025-05-29 14:32:01
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
我不给人做产品,给Agent做
2025-06-30 08:39:41
Meta 推 LlamaRL 强化学习框架:全异步分布设计,训练 AI 模型提速 10.7 倍
2025-06-11 16:14:21
黄仁勋2026大模型座上宾:杨植麟
2026-02-04 11:35:00
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
2025-06-01 13:22:14
721 文章
513453 浏览
24小时热文
更多
-
2026-04-05 22:13:40 -
2026-04-05 18:03:06 -
2026-04-05 18:01:58