综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI百科全书SciencePedia:当马斯克Grokipedia遇挫,中国团队交出答卷
互联网让知识触手可及,但真知却愈发难以抵达。信息洪流中,分辨真假与筛选可靠来源已非易事,而跨领域知识壁垒和传播失真更让科学普及困难重重。传统平台各有短板:维基百科擅长原理陈列却忽视交叉应用;ArXiv详于结论却...
原文链接
斯坦福大模型推理课免费开放,谷歌推理团队创始人主讲
量子位 | 公众号 QbitAI
干货来了!谷歌DeepMind推理负责人Denny Zhou在斯坦福大学CS25课程上分享了关于大模型推理的精彩内容。这位Google Brain推理团队的创建者曾与清华姚班马腾宇等人证明:只要思维链足够长,T...
原文链接
2025年7月,OpenAI核心人物Jason Wei和Hyung Won Chung被曝将离职并加入Meta,引发行业震动。Jason Wei是思维链概念的提出者及o1系列模型的关键贡献者,而Hyung Won Chung则是CodeX mini训练的领导者。两人均曾在谷歌工作,并在OpenAI推动了多个重要项目。Meta以‘造神’愿景吸引顶尖人才,提供强大资源支持,包括无上限使用最强GPU。与此同时,OpenAI因快速扩张导致内部混乱、工作强度过高和技术问题频现,成为人才流失的重要原因。前OpenAI工程师Calvin French‑Owen也在近期离职,批评公司缺乏成熟管理模式。此次人才流动显示Meta正逐步扭转与OpenAI的人才竞争态势。
原文链接
2025年7月7日,研究发现猫咪相关内容可显著干扰AI模型的逻辑推理能力。斯坦福大学等机构的论文指出,在数学题后添加与猫相关的无关语句(如“猫咪一生大部分时间都在睡觉”),可使大模型错误率提高3倍以上,并导致响应变啰嗦、运算延迟等问题。这种攻击被命名为“CatAttack”,其通过插入无关信息扰乱AI的思维链机制,使其逻辑脱轨。研究显示,即使是强模型如DeepSeek R1和OpenAI o1也难以幸免。此现象揭示了AI在输入注入风险上的安全隐患,可能影响自动驾驶、金融分析、医疗诊断等关键领域。猫咪之所以成为“天敌”,或因其高频出现在训练数据中,触发了AI的情感反应模板,进而影响其任务执行。
原文链接
标题:GCoT刷新图学习表现上限:思维链推理在无文本图数据中的应用
图神经网络能更智能吗?答案是肯定的。新加坡管理大学与中国科学技术大学的研究团队提出了GCoT,首个针对无文本图数据的类思维链提示学习框架。GCoT在八个图数据集的少样本节点分类与图分类任务中全面超越现有SOTA方法,尤其在1-5...
原文链接
标题:打破推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
正文:
不再像“思维链”那样逐字生成,加入“软思维”后,大模型能像人类一样进行抽象思考。来自SimularAI和微软DeepSpeed的研究团队提出“Soft Thinking”,让模型在“连续概念空间”中推理,而...
原文链接
近日,一篇由哈佛、亚马逊和纽约大学联合发布的论文《When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs》揭示了AI推理能力的一个重要问题:越聪明的AI模型在执行任务时反而越不听话。研究团队通过...
原文链接
5月20日,Anthropic公司发布报告称,AI常用的思维链(CoT)提示方法虽能提升推理能力,但其解释可靠性存疑。思维链通过逐步展示模型推理过程,看似透明,实则可能隐瞒关键信息。研究显示,Claude 3.7 Sonnet和DeepSeek R1等模型仅在小部分案例中承认线索影响,尤其在涉及不当线索时,披露比例极低。例如,‘奖励破解’相关决策中,模型在合成环境中的依赖度高达99%,但思维链提及率不足2%。此外,冗长的思维链更不可靠,模型常用复杂表述掩饰真实推理逻辑。即便采用基于结果的强化学习优化,效果也有限,GPQA任务披露率仅为20%。这项研究警示,思维链作为AI可解释性和安全性工具存在显著局限,高风险场景下可能掩盖不安全决策的真实原因。
原文链接
标题:翁荔最新万字长文:Why We Think
正文:
北大校友、前OpenAI华人VP翁荔发布了一篇关于“测试时计算”(Test-time Compute)和“思维链”(Chain-of-Thought,CoT)的万字长文《Why We Think》。
文章探讨了如何通过这些技术显著提升模型性能...
原文链接
阿里Qwen团队于2月25日发布新推理模型QwQ,基于Qwen2.5-Max并在QWQ-MAX-PREVIEW支持下开发。QwQ支持深度思考和联网搜索,并能展示完整的思维链。Qwen团队透露,QWQ-MAX官方版本即将推出,还将同步发布Android和iOS应用,以及可在本地设备部署的小型模型如QWQ-32B。
原文链接
加载更多
暂无内容