2025年10月,前特斯拉AI总监Andrej Karpathy发布新项目nanochat,以8000行代码和100美元成本在云GPU上训练出简易版ChatGPT模型。该项目通过Rust语言实现分词器,在FineWeb数据集上预训练Transformer架构,并在多项数据集上进行中期训练与指令微调,最终可用类ChatGPT界面交互。训练12小时后,模型CORE指标超越GPT-2;若提升至1000美元预算,可解决简单数学和代码问题。Karpathy表示,此项目旨在打造极简、易读的全栈LLM技术栈,未来有望发展为研究工具框架。目前,GitHub Star数已超4.8k,受到广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/26590.html
转载请注明文章出处
相关推荐
换一换
ChatGPT 被指与“先杀人后自杀”案有关,OpenAI、微软双双遭到起诉
2025-12-11 20:08:53
AI超过人类状元!ChatGPT最高分横扫日本顶尖大学考试
2026-04-27 22:39:09
用时 31 个月:ChatGPT 移动端全球累计吸金突破 30 亿美元大关,跑赢 TikTok 与多款流媒体应用
2025-12-19 12:51:08
数学家惊了!ChatGPT首次原创独立证明数学假设
2026-03-31 15:54:49
Intuit 与 OpenAI 达成 1 亿美元合作,让 ChatGPT 算退税、管财务
2025-11-18 22:41:13
黄仁勋:OpenClaw“绝对是下一个ChatGPT”
2026-03-18 08:58:01
OpenAI:ChatGPT 目前每周为超过 8 亿用户提供服务
2025-12-08 22:51:33
阿里千问团队谈“对标 ChatGPT”:希望他们没有的能力我们有
2025-11-17 12:22:42
最新测试版 App 代码显示,ChatGPT 未来或引入广告
2025-11-29 23:44:48
田渊栋卡帕西力荐Nano Banana新玩法:论文变漫画、手写解题以假乱真,谷歌这波赢麻了
2025-11-24 13:57:29
ChatGPT“代写”誓词,荷兰一对情侣婚礼被法院裁定无效
2026-01-09 10:06:12
OpenAI 奥尔特曼发布 GPT-5.1 系列:ChatGPT 情商大涨,AI 默认语气变“暖男”
2025-11-13 08:48:23
卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料
2025-11-23 14:08:11
717 文章
634254 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41