Kimi 发布视觉思考模型 k1：试题拍照给出答题思考全过程

2024-12-16 10:33:37

智慧棱镜

发布在

快讯

阅读：1256

12月16日，月之暗面Kimi发布了视觉思考模型k1，该模型基于强化学习技术，支持端到端图像理解和思维链技术，并在数学、物理、化学等基础科学领域的基准测试中超过OpenAI o1、GPT-4o及Claude 3.5 Sonnet。Kimi新模型已上线最新版“Kimi智能助手”APP及网页版Kimi+页面，用户可通过拍照或上传图片体验完整的推理过程。k1模型的训练分为两阶段，首先通过预训练得到基础模型，然后进行强化学习后训练，其字符识别能力在多项基准测试中表现优异。此外，Kimi模型研发团队自主构建了Science Vista测试集，涵盖不同难度的数理化图片题目，将开放给全行业使用。尽管如此，k1模型在分布外泛化、复杂问题成功率及多轮问答效果等方面仍需改进。

原文链接

本文链接：https://kx.umi6.com/article/10247.html

转载请注明文章出处

Kimi