标题:上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
国产o1新选手登场!它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,现已正式开放试用!
新模型不仅在长思维能力方面有了很大提升,还能在推理过程中进行自我反思和纠正。例如,InternThinker不仅能逐步猜出复杂的填字游戏答案,还能在过程中检查是否有冲突。此外,它的编程能力也更强,成功解决了中等难度的Leetcode赛题。
国外网友纷纷称赞:“中国公司的进步速度太快了!”书生InternThinker具备长思维能力,并能在推理过程中进行自我反思和纠正,在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
实现这一突破的关键在于以下三种策略: 1. 利用元认知理论学习思维模式,通过元动作如理解、知识回忆、规划、执行、反思和总结,让模型更灵活、多样、有效地解决问题。 2. “通专融合”的高密度监督数据路径,通过协作流程提升思维链的格式规范性和可学习性。 3. 构建大规模沙盒环境,提供反馈信号,确保模型在推理任务中的表现得到精准反馈。
InternThinker已在测试使用中,可通过链接体验更多有趣题目:https://internlm-chat.intern-ai.org.cn
原文链接
本文链接:https://kx.umi6.com/article/9404.html
转载请注明文章出处
相关推荐
换一换
DeepSeek 团队新作:把代码变成思维链,大模型推理各种能力全面提升
2025-02-17 15:53:30
2025年度最全面的AI报告:谁在赚钱,谁爱花钱,谁是草台班子
2025-10-13 17:00:38
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
AI独角兽Cohere创始人:我们不做ChatGPT的竞争对手;帮助企业采纳这项技术,并将其变得有价值
2024-12-09 14:26:34
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
2025-04-17 16:41:08
谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降
2025-06-19 09:43:42
AI进步放缓、遭遇瓶颈?OpenAI等头部公司:不存在
2024-11-29 17:58:36
谷歌Gemini 2.5 Pro发布即屠榜,代码推理杀疯了
2025-03-26 16:01:23
清华&通院推出”绝对零”训练法,零外部数据大模型自我博弈解锁推理能力
2025-05-12 17:37:13
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
OpenAI最强模型o1,仍分不出“9.11和9.8哪个大”
2024-09-13 12:16:49
GPT新版本猜想:奥特曼草莓图引发推理热潮
2024-09-06 12:03:27
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强
2025-05-31 16:07:25
549 文章
251975 浏览
24小时热文
更多
-
2025-10-24 19:49:44 -
2025-10-24 18:49:31 -
2025-10-24 18:49:20