标题:上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
国产o1新选手登场!它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,现已正式开放试用!
新模型不仅在长思维能力方面有了很大提升,还能在推理过程中进行自我反思和纠正。例如,InternThinker不仅能逐步猜出复杂的填字游戏答案,还能在过程中检查是否有冲突。此外,它的编程能力也更强,成功解决了中等难度的Leetcode赛题。
国外网友纷纷称赞:“中国公司的进步速度太快了!”书生InternThinker具备长思维能力,并能在推理过程中进行自我反思和纠正,在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
实现这一突破的关键在于以下三种策略: 1. 利用元认知理论学习思维模式,通过元动作如理解、知识回忆、规划、执行、反思和总结,让模型更灵活、多样、有效地解决问题。 2. “通专融合”的高密度监督数据路径,通过协作流程提升思维链的格式规范性和可学习性。 3. 构建大规模沙盒环境,提供反馈信号,确保模型在推理任务中的表现得到精准反馈。
InternThinker已在测试使用中,可通过链接体验更多有趣题目:https://internlm-chat.intern-ai.org.cn
原文链接
本文链接:https://kx.umi6.com/article/9404.html
转载请注明文章出处
相关推荐
换一换
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
昆仑万维「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试
2024-11-27 14:53:32
GPT新版本猜想:奥特曼草莓图引发推理热潮
2024-09-06 12:03:27
DeepAI CEO Kevin Baragona:大模型竞争的本质,已经从算力竞争变成了效率竞争 丨2024 T-EDGE
2024-12-12 18:00:58
上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1:仅7B参数,逼近DeepSeek满血版效果
2025-03-21 10:16:47
谷歌最强模型 Gemini 2.5 Pro 发布即屠榜,创下史上最大分数飞跃纪录
2025-03-26 07:38:39
大模型下半场:7个趋势判断
2025-04-02 19:40:41
DeepSeek 团队新作:把代码变成思维链,大模型推理各种能力全面提升
2025-02-17 15:53:30
OpenAI正在悄悄研发代号“草莓”的神秘项目,其能力或已达到博士水平
2024-07-15 18:48:38
地球上最聪明的AI!马斯克发布Grok 3:秒杀GPT 超越DeepSeek
2025-02-18 13:21:40
谷歌 DeepMind 优化 AI 模型新思路,计算效率与推理能力兼得
2024-12-28 10:24:13
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
2025-05-29 20:40:27
陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现
2024-06-28 22:10:00
596 文章
332491 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05