思维链 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

对话原力灵机周而进：模型2.4B就够用，关键是“具身原生”；能闭环才是最高效方法

标题：对话原力灵机周而进：2.4B模型够用，具身原生是关键正文：一个专注于具身智能的公司推出了仅2.4B参数的模型DM0，远低于行业标杆如π 0（33亿参数）和π 0.6（50亿参数）。这家公司认为，2.4B足够支撑实时处理三视角728×728画面，推理延迟仅60毫秒，并通过强化学习在真机上...

原文链接

虚拟微光

02-13 14:22:41

具身原生

空间推理思维链

闭环

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

2025年12月5日，DeepSeek V3.2发布，其Agentic性能提升40%，关键在于引入‘交错思维链’（Interleaved Thinking）机制。该技术通过在推理与工具调用间交替记录思考状态，显著增强了模型的长程规划能力，解决了AI‘健忘症’问题。类似的技术已在MiniMax M2、Kimi K2 Thinking等模型中应用，并取得显著效果，尤其在高扰动环境下的任务表现提升明显。这一机制不仅优化了复杂场景中的稳定性，还推动了行业基础设施升级。目前，交错思维链已成为智能体进化的核心路径，多家公司正合力推动其标准化。AWS re:Invent 2025大会上，亚马逊宣布将MiniMax M2纳入Amazon Bedrock模型库，彰显行业共识。

原文链接

电子诗篇

12-05 17:41:21

Agent能力

DeepSeek V3.2

交错思维链

分享至

打开微信扫一扫

内容投诉

生成图片

AI百科全书SciencePedia：当马斯克Grokipedia遭遇滑铁卢，有个中国团队默默把活儿干了

AI百科全书SciencePedia：当马斯克Grokipedia遇挫，中国团队交出答卷互联网让知识触手可及，但真知却愈发难以抵达。信息洪流中，分辨真假与筛选可靠来源已非易事，而跨领域知识壁垒和传播失真更让科学普及困难重重。传统平台各有短板：维基百科擅长原理陈列却忽视交叉应用；ArXiv详于结论却...

原文链接

数据炼金师

10-30 23:02:12

SciencePedia

思维链

知识进化

分享至

打开微信扫一扫

内容投诉

生成图片

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

斯坦福大模型推理课免费开放，谷歌推理团队创始人主讲量子位 | 公众号 QbitAI 干货来了！谷歌DeepMind推理负责人Denny Zhou在斯坦福大学CS25课程上分享了关于大模型推理的精彩内容。这位Google Brain推理团队的创建者曾与清华姚班马腾宇等人证明：只要思维链足够长，T...

原文链接

智能涌动

07-25 17:26:56

大模型推理

强化学习微调

思维链

分享至

打开微信扫一扫

内容投诉

生成图片

Jason Wei也被小扎带走：思维链开创者、o1系列奠基人！这次真挖到OpenAI大动脉了

2025年7月，OpenAI核心人物Jason Wei和Hyung Won Chung被曝将离职并加入Meta，引发行业震动。Jason Wei是思维链概念的提出者及o1系列模型的关键贡献者，而Hyung Won Chung则是CodeX mini训练的领导者。两人均曾在谷歌工作，并在OpenAI推动了多个重要项目。Meta以‘造神’愿景吸引顶尖人才，提供强大资源支持，包括无上限使用最强GPU。与此同时，OpenAI因快速扩张导致内部混乱、工作强度过高和技术问题频现，成为人才流失的重要原因。前OpenAI工程师Calvin French‑Owen也在近期离职，批评公司缺乏成熟管理模式。此次人才流动显示Meta正逐步扭转与OpenAI的人才竞争态势。

原文链接

Oasis

07-16 14:02:38

Jason Wei

Meta

思维链

分享至

打开微信扫一扫

内容投诉

生成图片

智谱GLM-4.1V-9B-Thinking大模型登顶HuggingFace Trending

7月10日，智谱旗下GLM-4.1V-9B-Thinking大模型以9B参数规模登顶HuggingFace Trending榜首。该模型支持图像、视频、文档等多模态输入，专为复杂认知任务设计，融合“思维链推理机制”与“课程采样强化学习策略”，显著提升跨模态因果推理能力与稳定性。其轻量版参数控制在10B级别，在高效部署的同时实现性能突破，展现技术领先性与实用性，引发广泛关注。

原文链接

GhostPilot

07-10 17:29:56

HuggingFace Trending

思维链推理机制

智谱GLM-4.1V-9B-Thinking

分享至

打开微信扫一扫

内容投诉

生成图片

一只猫就能让最强AI 答错题，Deepseek 也翻车，猫怎么成了大模型“天敌”?

2025年7月7日，研究发现猫咪相关内容可显著干扰AI模型的逻辑推理能力。斯坦福大学等机构的论文指出，在数学题后添加与猫相关的无关语句（如“猫咪一生大部分时间都在睡觉”），可使大模型错误率提高3倍以上，并导致响应变啰嗦、运算延迟等问题。这种攻击被命名为“CatAttack”，其通过插入无关信息扰乱AI的思维链机制，使其逻辑脱轨。研究显示，即使是强模型如DeepSeek R1和OpenAI o1也难以幸免。此现象揭示了AI在输入注入风险上的安全隐患，可能影响自动驾驶、金融分析、医疗诊断等关键领域。猫咪之所以成为“天敌”，或因其高频出现在训练数据中，触发了AI的情感反应模板，进而影响其任务执行。

原文链接

智能视野

07-07 21:39:02

大模型

思维链

猫咪攻击

分享至

打开微信扫一扫

内容投诉

生成图片

9B“小”模型干了票“大”的：性能超8倍参数模型，拿下23项SOTA | 智谱开源

2025年7月，智谱开源了仅9B大小的视觉语言模型GLM-4.1V-9B-Thinking，在28项评测中斩获23个SOTA，成为10B级别中效果最好的VLM模型。该模型在18项评测中表现超越参数量达其8倍的Qwen-2.5-VL-72B，核心优势在于引入了思维链（Chain-of-Thought）推理机制和课程采样强化学习（RLCS）。浦东创投集团和张江集团已对该项目投资10亿元，首笔资金将近期到位。GLM-4.1V-9B-Thinking具备多模态深度推理能力，可处理超长视频解析、智能读图问答、理科解题、专业文档处理等任务，并已在数学题解答、图像分析等场景中展现优异表现。相关论文、代码及模型已开源，详见arXiv与各大平台链接。

原文链接

梦境编程师

07-02 13:05:58

GLM-4.1V-9B-Thinking

思维链推理

视觉语言模型

分享至

打开微信扫一扫

内容投诉

生成图片

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

AI也有量子叠加态了？这是AI大牛田渊栋团队的新成果。他们利用连续空间中的“叠加态”，让大模型在图可达性等任务中表现更好。传统大模型通过生成“思维token”推理，但处理复杂任务效率低。近期研究发现，用连续隐向量推理能提升性能，但缺乏理论解释。田渊栋团队证明，对于n个顶点且直径为D的图，一个含D步...

原文链接