1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达于1月13日发布了一款名为Nemotron-CC的大型AI训练数据库,包含6.3万亿Token,其中1.9万亿为合成数据。该数据库旨在解决现有公开数据库在规模和质量上的局限性,有助于推动大语言模型的训练。Nemotron-CC基于Common Crawl网站数据构建,经过严格处理流程形成高质量子集Nemotron-CC-HQ。与现有领先数据库DCLM相比,使用Nemotron-CC-HQ训练的模型在MMLU基准测试中得分提高5.6分。此外,Nemotron-CC训练的80亿参数模型在多个基准测试中均有显著提升。英伟达表示,Nemotron-CC已公开在Common Crawl网站上。

原文链接
本文链接:https://kx.umi6.com/article/11611.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
英伟达与OpenAI正在铸造AI主权
2025-09-23 15:17:00
黄仁勋:合作将英伟达AI和英特尔CPU紧密结合在一起
2025-09-18 20:03:52
英特尔还不能急着开心
2025-09-19 16:20:10
首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布
2025-09-10 01:24:36
英伟达新GPU,超长上下文/视频生成专用
2025-09-14 14:42:14
英伟达入局Robotaxi?业内人士:或打造“开放版FSD”吸引车企合作
2025-09-24 19:50:45
英伟达:弥补弱点,乘上人工智能热潮
2025-09-02 12:32:42
阿里巴巴宣布与英伟达开展Physical AI合作
2025-09-24 15:49:08
英伟达将收购50亿美元的英特尔股份 每股作价23.28美元
2025-09-18 20:01:36
AI股上涨的“永动机”,还能继续吗?
2025-09-30 20:32:32
AIDC呼唤电源架构升级 英伟达联手富士康推动HVDC落地
2025-10-14 09:13:20
黄仁勋出手,50亿美元入股英特尔,英伟达一统“GPU+x86”生态
2025-09-19 11:14:09
24小时热文
更多
扫一扫体验小程序