1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年9月,加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究团队发现,大语言模型在心算任务中几乎所有的数学计算集中在序列的最后一个token上完成。研究通过上下文感知平均消融(CAMA)和基于注意力的窥视(ABP)技术对Llama-3-8B等模型进行实验,揭示了‘人人为我’(AF1)稀疏子图的存在。该机制显示,模型将通用计算与特定计算分离,前几层仅做准备工作,中间层传递信息,最后由末尾token完成运算。实验表明,AF1子图大幅减少计算量但仍保持高准确率,尤其在简单算术任务中表现突出,但在语义理解任务中失效。研究为理解语言模型的内部计算机制提供了新视角,并提出方法论创新,或可推广至更广泛领域。

原文链接
本文链接:https://kx.umi6.com/article/25193.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI解数学题只靠最后一个token
2025-09-14 13:40:03
苹果公司AI高管Robby Walker将离职
2025-09-13 12:25:32
谷歌云与英国国防部签订价值4亿英镑合同 提供主权云服务
2025-09-12 17:24:14
存力接棒AI基建?英伟达望向GPU+SSD 存储涨价预期持续发酵
2025-09-14 09:37:20
阶跃星辰姜大昕:智能体未来将呈现三大发展趋势
2025-09-12 11:13:06
晶圆代工,台积电吃下全部增长
2025-09-14 13:41:16
美团发布首款AI Agent产品“小美”App
2025-09-12 10:12:46
甲骨文两日累跌超10% 市场担忧其过度依赖OpenAI
2025-09-13 00:21:07
AlphaGo作者领衔,DeepMind新作登Science子刊
2025-09-14 14:44:48
“AI之王”当之无愧!英伟达“最大空头”倒戈上调评级:还能再涨19%
2025-09-12 12:15:09
为什么短视频总能打败书本?潜藏在意识背后的秘密
2025-09-14 10:36:57
烟台新首富,来自4600亿中际旭创
2025-09-12 17:18:31
率先进入HBM4量产点燃市场热情 SK海力士股价刷新历史纪录!
2025-09-12 17:23:18
24小时热文
更多
扫一扫体验小程序