标题:1930年的AI也能写代码?
正文:
Jay 发自 凹非寺
量子位 | 公众号 QbitAI
一个仅掌握1930年以前知识的AI模型,经过微调后竟然能解决现代编程问题。这款名为“talkie-1930-13b”的模型,由AI研究员Nick Levine、多伦多大学副教授David Duvenaud及GPT系列之父Alec Radford共同开发。它的训练数据严格限定在1931年之前的内容,完全不知道电视机、互联网或二战后的世界。
尽管如此,这个“百岁老人”却成功写出了人生第一行Python代码,并完成了一个针对xarray库的小补丁。通过仅250个训练样本,它学会了修复真实软件工程问题,展示了惊人的学习能力。虽然过程缓慢且笨拙,经历了49轮对话才最终完成任务,但其试错、反思和自我修正的能力令人印象深刻。
更有趣的是,当训练数据扩展到约75K条轨迹(相当于10亿token)时,该模型在SWE-bench-Verified上的表现达到了4.5%的pass@1,相比初始水平有显著提升。作为对照实验,团队还训练了另一个基于互联网数据的模型“talkie-web”,其成绩为5.5%,仅高出1个百分点。这表明,即使是受限的历史数据,也可能孕育出现代意义上的推理能力。
这一成果引发了关于智能本质的讨论。我们通常认为AI需要海量数据才能变聪明,但“talkie-1930”证明,少量高质量数据加上正确的方法,足以激发强大的潜力。或许,智能的瓶颈并非预训练数据的数量,而是如何有效利用这些数据。
项目已开源,欢迎复现与探索:
GitHub链接:https://github.com/RicardoDominguez/talkie-coder
原文链接
本文链接:https://kx.umi6.com/article/35440.html
转载请注明文章出处
相关推荐
换一换
三部门:将技术改造和设备更新贷款支持范围扩展至电子信息、人工智能、设施农业、消费商业设施等14个领域
2026-04-30 18:43:30
DeepSeek上线识图模式
2026-04-29 18:38:04
Alphabet CEO:一季度基于生成式人工智能模型产品收入同比增长近800%
2026-04-30 14:28:02
钉钉“听劝”推出充电宝版录音卡,可连续录音180小时
2026-04-30 14:24:57
撕开Claude Code真相:让它好用的98.4%,是工程不是AI
2026-05-03 16:32:14
Stripe 发布 288 项新功能,构建 AI 时代的经济基础设施
2026-04-30 17:35:59
库克终于放下重担,Siri一句「我听不懂」,苹果的AI时代就过去了
2026-04-30 17:38:10
郑栅洁:推进算力资源规模化、集约化、绿色化、普惠化发展 深化拓展“人工智能+”
2026-05-01 12:30:30
正面刚老黄!谷歌TPU 8i的「偷家」战术:不打最贵的仗,只割最肥的肉
2026-04-30 12:21:30
担心被Skill替代的打工人发现:“根本不是那么回事”
2026-04-30 17:45:59
10万引普林斯顿刘壮最新访谈:架构没那么重要,数据才是王道
2026-04-29 13:23:01
谷歌股价大涨8%单日增加市值3400亿美元 一季度谷歌云迎爆发式增长
2026-04-30 23:55:48
华为携手中科大发布灵境造物,openJiuwen首发Coordination Engineering全栈支撑
2026-05-01 22:50:14
725 文章
578698 浏览
24小时热文
更多
-
2026-05-03 22:48:13 -
2026-05-03 21:45:02 -
2026-05-03 18:37:42