1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
卡帕西8000行代码手搓ChatGPT,成本仅100美元,训练12小时CORE表现超越GPT-2,手把手教程来了
2025年10月,前特斯拉AI总监Andrej Karpathy发布新项目nanochat,以8000行代码和100美元成本在云GPU上训练出简易版ChatGPT模型。该项目通过Rust语言实现分词器,在FineWeb数据集上预训练Transformer架构,并在多项数据集上进行中期训练与指令微调,最终可用类ChatGPT界面交互。训练12小时后,模型CORE指标超越GPT-2;若提升至1000美元预算,可解决简单数学和代码问题。Karpathy表示,此项目旨在打造极简、易读的全栈LLM技术栈,未来有望发展为研究工具框架。目前,GitHub Star数已超4.8k,受到广泛关注。
电子诗篇
10-14 11:12:48
ChatGPT
nanochat
卡帕西
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序