1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:1930年的AI也能写代码?

正文:
Jay 发自 凹非寺
量子位 | 公众号 QbitAI

一个仅掌握1930年以前知识的AI模型,经过微调后竟然能解决现代编程问题。这款名为“talkie-1930-13b”的模型,由AI研究员Nick Levine、多伦多大学副教授David Duvenaud及GPT系列之父Alec Radford共同开发。它的训练数据严格限定在1931年之前的内容,完全不知道电视机、互联网或二战后的世界。

尽管如此,这个“百岁老人”却成功写出了人生第一行Python代码,并完成了一个针对xarray库的小补丁。通过仅250个训练样本,它学会了修复真实软件工程问题,展示了惊人的学习能力。虽然过程缓慢且笨拙,经历了49轮对话才最终完成任务,但其试错、反思和自我修正的能力令人印象深刻。

更有趣的是,当训练数据扩展到约75K条轨迹(相当于10亿token)时,该模型在SWE-bench-Verified上的表现达到了4.5%的pass@1,相比初始水平有显著提升。作为对照实验,团队还训练了另一个基于互联网数据的模型“talkie-web”,其成绩为5.5%,仅高出1个百分点。这表明,即使是受限的历史数据,也可能孕育出现代意义上的推理能力。

这一成果引发了关于智能本质的讨论。我们通常认为AI需要海量数据才能变聪明,但“talkie-1930”证明,少量高质量数据加上正确的方法,足以激发强大的潜力。或许,智能的瓶颈并非预训练数据的数量,而是如何有效利用这些数据。

项目已开源,欢迎复现与探索:
GitHub链接:https://github.com/RicardoDominguez/talkie-coder

原文链接
本文链接:https://kx.umi6.com/article/35440.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
ARM CEO:美对华禁运AI CPU几乎不可能!比禁GPU难多了
2026-06-03 16:29:54
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
Gartner 高挺:机器人产业迈入 GPT-2 发展周期,企业落地切忌盲目布局人形机器人
2026-06-05 10:57:10
英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」
2026-05-30 11:47:09
全球首个机器人训练楼盘开盘:30万套中国住宅,机器人拎包入住
2026-06-05 15:01:09
祖国人公开反对AI!称AI打心底反感人类
2026-06-07 14:40:43
智源&清华合作成果登上Science:脑科学多模态基础模型Brainμ支撑揭示“记忆-睡眠”调控的神经机制
2026-06-05 19:13:44
刚刚,Anthropic提交了招股书!
2026-06-03 12:19:08
全方位AI超进化!华硕 COMPUTEX 2026 开启企业至边缘 AI 转型新篇章
2026-06-05 12:56:42
App Store年成交1.4万亿美元 AI应用打开增量成长空间
2026-06-05 01:32:40
MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它
2026-06-03 00:53:27
阶跃Step 3.7 Flash登顶AA榜:速度、性价比、端到端三项第一
2026-06-05 14:59:31
字节开源统一框架Bernini:给DiT配个“大模型军师”,AI视频编辑先理解再动手
2026-06-02 18:37:35
24小时热文
更多
扫一扫体验小程序