标题:上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
国产o1新选手登场!它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,现已正式开放试用!
新模型不仅在长思维能力方面有了很大提升,还能在推理过程中进行自我反思和纠正。例如,InternThinker不仅能逐步猜出复杂的填字游戏答案,还能在过程中检查是否有冲突。此外,它的编程能力也更强,成功解决了中等难度的Leetcode赛题。
国外网友纷纷称赞:“中国公司的进步速度太快了!”书生InternThinker具备长思维能力,并能在推理过程中进行自我反思和纠正,在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
实现这一突破的关键在于以下三种策略: 1. 利用元认知理论学习思维模式,通过元动作如理解、知识回忆、规划、执行、反思和总结,让模型更灵活、多样、有效地解决问题。 2. “通专融合”的高密度监督数据路径,通过协作流程提升思维链的格式规范性和可学习性。 3. 构建大规模沙盒环境,提供反馈信号,确保模型在推理任务中的表现得到精准反馈。
InternThinker已在测试使用中,可通过链接体验更多有趣题目:https://internlm-chat.intern-ai.org.cn
原文链接
本文链接:https://kx.umi6.com/article/9404.html
转载请注明文章出处
相关推荐
.png)
换一换
让AI自发推理!引发热议的“DeepSeek”到底是个啥
2025-02-01 01:08:43
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
2025-08-01 08:51:42
OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题
2024-09-13 08:08:03
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
2025-05-29 20:40:27
“AI小财神”推理能力全面升级 做投资者的“深度思考官”
2025-02-13 11:00:46
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
国产AI搜索接入DeepSeek-R1!我们深度试玩了一下
2025-02-03 10:06:40
苹果最新研究:现有 AI 大模型“更像是在记忆,而非真正的推理”
2025-06-08 17:10:55
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
2025-04-17 16:41:08
非技术人10分钟读懂Deepseek R1
2025-02-14 18:44:39
地球上最聪明的AI!马斯克发布Grok 3:秒杀GPT 超越DeepSeek
2025-02-18 13:21:40
谷歌 DeepMind 优化 AI 模型新思路,计算效率与推理能力兼得
2024-12-28 10:24:13
Claude 4被曝发布在即!被DeepSeek逼得都把大招拿出来了
2025-02-14 15:39:52
509 文章
173334 浏览
24小时热文
更多

-
2025-09-09 00:06:37
-
2025-09-09 00:05:10
-
2025-09-08 23:04:48