综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月2日,IT之家发起互动话题‘用一个字证明你不是AI’,引发热议。语文教师@教语文的萱萱萱ww提出的高中作文题在B站视频播放量达487万,最高排名榜单第4位。随着AI技术发展,其能力已覆盖文案、代码、诗画创作,并预计在2026年加速普及智能体(Agents),传统图灵测试面临失效。尽管AI逻辑严谨,却难以复制人类独有的‘人味儿’和真实感。IT之家评论区现正开启‘真人验身仪式’,邀请网友用一个字证明自己的碳基身份。
原文链接
6月6日,苹果机器学习研究中心发布论文指出,现有AI大模型更像是在记忆而非真正推理。研究评估了OpenAI、DeepSeek、Anthropic及谷歌的前沿推理模型,发现虽能在中等复杂任务中表现良好,但在高复杂度任务中性能急剧下降至零准确率。研究显示,随着问题难度增加,模型用于‘思考’的token数量反而减少,表明现有推理方法存在根本性局限。研究人员通过可控解谜环境分析模型内部推理轨迹,将任务分为低、中、高复杂度三个阶段,发现两类模型在高复杂度任务中均失效。此研究质疑了当前基于数学基准的评估方式,强调需更细致的实验设计以深入理解模型能力与局限,为未来研究提供方向。
原文链接
标题:大模型推理能力的脆弱性揭示
一个月前,OpenAI发布的o1在处理复杂推理任务时展现出非凡能力,尤其在解答难度极高的数学问题时表现出色。然而,最近的研究揭示了大模型推理能力的脆弱性。
一篇名为《理解大语言模型在数学推理的局限性》的论文指出,向大模型提出的问题中加入无关信息,即使是简单的小学数学...
原文链接
AI配件新星Plaud Note在海外众筹平台Kickstarter和Indiegogo上引发关注,首秀即打破同类目记录,预售阶段销售额近600万美元。该产品主打AI录音功能,声称是全球首款由ChatGPT支持的录音机,能吸附在iPhone背面,无需额外App或权限,解决iPhone通话录音难题。P...
原文链接
标题:AI助手助力工作:效率提升还是新挑战?
人工智能如ChatGPT在科研、写作和设计等领域展现了惊人的能力,比如博士研究生张逸用它节省了80%的编程时间。AI作为情绪稳定的助手,从代码转换、知识查询到撰写辅助,正在改变人们的工作习惯。法官助理郭筱用AI简化判决文书编写,减轻重复性任务负担。
然而...
原文链接
加载更多
暂无内容