4月15日,前Windows核心开发者Dave Plummer在一台47年前的PDP-11/44计算机上成功运行了名为ATTN-11的Transformer模型。该模型由Damien Boureille用汇编语言编写,仅含1216个参数,任务是将输入数字序列反序输出。Plummer通过极致优化,在6MHz CPU和64KB内存的限制下,借助一块缓存板,耗时3.5分钟完成约350个训练步骤,使模型达到100%准确率。他强调,AI本质是机器反复调整加权连接以优化结果,并指出未来AI竞争中,对效率和优化的追求将成关键优势。
原文链接
本文链接:https://kx.umi6.com/article/34830.html
转载请注明文章出处
相关推荐
换一换
π0.7发布,VLA押出了机器人的GPT-3时刻
2026-04-17 15:05:44
Kimi新论文:把KVCache玩成新商业模式了
2026-04-19 19:19:25
马斯克来抖音卖老干妈了??
2026-04-19 13:03:40
台积电:人工智能需求极为强劲 未来3年资本支出将显著高于过去3年
2026-04-16 16:10:15
具身智能为什么还没真正落地?问题卡在这|沙龙报名
2026-04-16 10:52:19
全球算力告急!OpenAI豪掷1450亿疯狂囤算力
2026-04-17 18:16:48
台积电CEO:全力扩产仍难以满足强劲AI需求
2026-04-16 20:20:10
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决
2026-04-19 13:02:16
瑞银:预计标普500指数成分企业第一季度利润将创自2021年四季度以来最快增速 未来一年美股仍有上涨空间
2026-04-17 15:08:02
AI开始接管实验室了!玻尔·跃迁实验室:试剂、设备、数据一个入口搞定,1800+设备即插即用
2026-04-19 00:31:05
第一批学AI的大学生 已经笑不出来了
2026-04-19 15:07:03
李想:不要招聘非原生AI人才
2026-04-17 00:30:52
发改委:在网络、数据、人工智能、生物、生态、核、太空、深海、极地、低空等新兴领域 增强薄弱环节风险防控能力
2026-04-17 12:00:25
790 文章
595108 浏览
24小时热文
更多
-
2026-04-19 22:26:56 -
2026-04-19 21:23:46 -
2026-04-19 19:19:25