标题:1930年的AI也能写代码?
正文:
Jay 发自 凹非寺
量子位 | 公众号 QbitAI
一个仅掌握1930年以前知识的AI模型,经过微调后竟然能解决现代编程问题。这款名为“talkie-1930-13b”的模型,由AI研究员Nick Levine、多伦多大学副教授David Duvenaud及GPT系列之父Alec Radford共同开发。它的训练数据严格限定在1931年之前的内容,完全不知道电视机、互联网或二战后的世界。
尽管如此,这个“百岁老人”却成功写出了人生第一行Python代码,并完成了一个针对xarray库的小补丁。通过仅250个训练样本,它学会了修复真实软件工程问题,展示了惊人的学习能力。虽然过程缓慢且笨拙,经历了49轮对话才最终完成任务,但其试错、反思和自我修正的能力令人印象深刻。
更有趣的是,当训练数据扩展到约75K条轨迹(相当于10亿token)时,该模型在SWE-bench-Verified上的表现达到了4.5%的pass@1,相比初始水平有显著提升。作为对照实验,团队还训练了另一个基于互联网数据的模型“talkie-web”,其成绩为5.5%,仅高出1个百分点。这表明,即使是受限的历史数据,也可能孕育出现代意义上的推理能力。
这一成果引发了关于智能本质的讨论。我们通常认为AI需要海量数据才能变聪明,但“talkie-1930”证明,少量高质量数据加上正确的方法,足以激发强大的潜力。或许,智能的瓶颈并非预训练数据的数量,而是如何有效利用这些数据。
项目已开源,欢迎复现与探索:
GitHub链接:https://github.com/RicardoDominguez/talkie-coder
原文链接
本文链接:https://kx.umi6.com/article/35440.html
转载请注明文章出处
相关推荐
换一换
陶哲轩12年前的预言,现在AI帮他兑现了
2026-06-20 20:21:47
“AI填志愿”成高考后新现象,超1400万人在和千问聊高考
2026-06-25 09:09:04
刚刚,Claude Code大升级!卡帕西:LLM第三次变革
2026-06-24 12:28:55
豆包收费版第一天,我:充值…又得充值?我要再充值!
2026-06-25 09:10:34
AI“抢饭碗”?贝索斯:恰恰相反
2026-06-18 15:32:41
AI巨头的Token补贴大战 快打完了吗?
2026-06-22 00:15:24
霍启刚:AI纪元自己判断才是核心 不能直接照搬
2026-06-24 10:24:15
我把昨晚的梦输入AI,它居然直接把我拉进去玩儿了一把?!
2026-06-19 17:26:33
用豆包专业版干活后 我承认之前是我说话太大声了
2026-06-25 07:06:13
全球首个AI艺术博物馆:谷歌协力打造 生成12亿像素超现实画面
2026-06-19 20:32:00
周鸿祎:AI不会带来大规模裁员 出错后还得有人给AI擦屁股
2026-06-24 18:46:20
入局AI新风向,WAIC 2026全球开票!
2026-06-18 15:29:28
小扎「蒸馏员工」计划紧急喊停!私聊数据都泄露了…
2026-06-23 09:26:07
747 文章
731690 浏览
24小时热文
更多
-
2026-06-25 09:10:34 -
2026-06-25 09:09:04 -
2026-06-25 08:05:58