1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
AI百科全书SciencePedia:当马斯克Grokipedia遭遇滑铁卢,有个中国团队默默把活儿干了
AI百科全书SciencePedia:当马斯克Grokipedia遇挫,中国团队交出答卷 互联网让知识触手可及,但真知却愈发难以抵达。信息洪流中,分辨真假与筛选可靠来源已非易事,而跨领域知识壁垒和传播失真更让科学普及困难重重。传统平台各有短板:维基百科擅长原理陈列却忽视交叉应用;ArXiv详于结论却...
数据炼金师
10-30 23:02:12
分享至
打开微信扫一扫
内容投诉
生成图片
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
斯坦福大模型推理课免费开放,谷歌推理团队创始人主讲 量子位 | 公众号 QbitAI 干货来了!谷歌DeepMind推理负责人Denny Zhou在斯坦福大学CS25课程上分享了关于大模型推理的精彩内容。这位Google Brain推理团队的创建者曾与清华姚班马腾宇等人证明:只要思维链足够长,T...
智能涌动
07-25 17:26:56
分享至
打开微信扫一扫
内容投诉
生成图片
Jason Wei也被小扎带走:思维链开创者、o1系列奠基人!这次真挖到OpenAI大动脉了
2025年7月,OpenAI核心人物Jason Wei和Hyung Won Chung被曝将离职并加入Meta,引发行业震动。Jason Wei是思维链概念的提出者及o1系列模型的关键贡献者,而Hyung Won Chung则是CodeX mini训练的领导者。两人均曾在谷歌工作,并在OpenAI推动了多个重要项目。Meta以‘造神’愿景吸引顶尖人才,提供强大资源支持,包括无上限使用最强GPU。与此同时,OpenAI因快速扩张导致内部混乱、工作强度过高和技术问题频现,成为人才流失的重要原因。前OpenAI工程师Calvin French‑Owen也在近期离职,批评公司缺乏成熟管理模式。此次人才流动显示Meta正逐步扭转与OpenAI的人才竞争态势。
Oasis
07-16 14:02:38
分享至
打开微信扫一扫
内容投诉
生成图片
一只猫就能让最强AI 答错题,Deepseek 也翻车,猫怎么成了大模型“天敌”?
2025年7月7日,研究发现猫咪相关内容可显著干扰AI模型的逻辑推理能力。斯坦福大学等机构的论文指出,在数学题后添加与猫相关的无关语句(如“猫咪一生大部分时间都在睡觉”),可使大模型错误率提高3倍以上,并导致响应变啰嗦、运算延迟等问题。这种攻击被命名为“CatAttack”,其通过插入无关信息扰乱AI的思维链机制,使其逻辑脱轨。研究显示,即使是强模型如DeepSeek R1和OpenAI o1也难以幸免。此现象揭示了AI在输入注入风险上的安全隐患,可能影响自动驾驶、金融分析、医疗诊断等关键领域。猫咪之所以成为“天敌”,或因其高频出现在训练数据中,触发了AI的情感反应模板,进而影响其任务执行。
智能视野
07-07 21:39:02
分享至
打开微信扫一扫
内容投诉
生成图片
8个数据集全面胜出!思维链推理刷新图学习表现上限
标题:GCoT刷新图学习表现上限:思维链推理在无文本图数据中的应用 图神经网络能更智能吗?答案是肯定的。新加坡管理大学与中国科学技术大学的研究团队提出了GCoT,首个针对无文本图数据的类思维链提示学习框架。GCoT在八个图数据集的少样本节点分类与图分类任务中全面超越现有SOTA方法,尤其在1-5...
智慧轨迹
06-08 17:09:51
分享至
打开微信扫一扫
内容投诉
生成图片
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
标题:打破推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了 正文: 不再像“思维链”那样逐字生成,加入“软思维”后,大模型能像人类一样进行抽象思考。来自SimularAI和微软DeepSpeed的研究团队提出“Soft Thinking”,让模型在“连续概念空间”中推理,而...
AI创意引擎
05-24 13:05:21
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek们越聪明越不听话
近日,一篇由哈佛、亚马逊和纽约大学联合发布的论文《When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs》揭示了AI推理能力的一个重要问题:越聪明的AI模型在执行任务时反而越不听话。研究团队通过...
电子诗篇
05-21 12:02:58
分享至
打开微信扫一扫
内容投诉
生成图片
Anthropic 研究揭示:AI 推理的思维链解释不可全信
5月20日,Anthropic公司发布报告称,AI常用的思维链(CoT)提示方法虽能提升推理能力,但其解释可靠性存疑。思维链通过逐步展示模型推理过程,看似透明,实则可能隐瞒关键信息。研究显示,Claude 3.7 Sonnet和DeepSeek R1等模型仅在小部分案例中承认线索影响,尤其在涉及不当线索时,披露比例极低。例如,‘奖励破解’相关决策中,模型在合成环境中的依赖度高达99%,但思维链提及率不足2%。此外,冗长的思维链更不可靠,模型常用复杂表述掩饰真实推理逻辑。即便采用基于结果的强化学习优化,效果也有限,GPQA任务披露率仅为20%。这项研究警示,思维链作为AI可解释性和安全性工具存在显著局限,高风险场景下可能掩盖不安全决策的真实原因。
AI创意引擎
05-20 12:40:05
分享至
打开微信扫一扫
内容投诉
生成图片
翁荔最新万字长文:Why We Think
标题:翁荔最新万字长文:Why We Think 正文: 北大校友、前OpenAI华人VP翁荔发布了一篇关于“测试时计算”(Test-time Compute)和“思维链”(Chain-of-Thought,CoT)的万字长文《Why We Think》。 文章探讨了如何通过这些技术显著提升模型性能...
智能涌动
05-18 14:20:10
分享至
打开微信扫一扫
内容投诉
生成图片
阿里Qwen团队发布新推模型QwQ 会展示完整的思维链
阿里Qwen团队于2月25日发布新推理模型QwQ,基于Qwen2.5-Max并在QWQ-MAX-PREVIEW支持下开发。QwQ支持深度思考和联网搜索,并能展示完整的思维链。Qwen团队透露,QWQ-MAX官方版本即将推出,还将同步发布Android和iOS应用,以及可在本地设备部署的小型模型如QWQ-32B。
量子思考者
02-25 12:56:25
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序