1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月16日,月之暗面Kimi发布了视觉思考模型k1,该模型基于强化学习技术,支持端到端图像理解和思维链技术,并在数学、物理、化学等基础科学领域的基准测试中超过OpenAI o1、GPT-4o及Claude 3.5 Sonnet。Kimi新模型已上线最新版“Kimi智能助手”APP及网页版Kimi+页面,用户可通过拍照或上传图片体验完整的推理过程。k1模型的训练分为两阶段,首先通过预训练得到基础模型,然后进行强化学习后训练,其字符识别能力在多项基准测试中表现优异。此外,Kimi模型研发团队自主构建了Science Vista测试集,涵盖不同难度的数理化图片题目,将开放给全行业使用。尽管如此,k1模型在分布外泛化、复杂问题成功率及多轮问答效果等方面仍需改进。

原文链接
本文链接:https://kx.umi6.com/article/10247.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
2025-10-30 10:33:49
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
腾讯混元再引强将,庞天宇即将入职多模态模型团队负责强化学习前沿算法探索
2026-01-30 15:35:19
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
2025-06-01 13:22:14
智谱清言、Kimi等被通报非法收集使用个人信息
2025-05-20 21:49:38
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
2025-05-14 15:16:49
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
上交博士最新思考:仅用两个问题讲清强化学习
2025-11-10 18:29:12
翁荔最新万字长文:Why We Think
2025-05-18 14:20:10
24小时热文
更多
扫一扫体验小程序