1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

英伟达于1月13日发布了一款名为Nemotron-CC的大型AI训练数据库,包含6.3万亿Token,其中1.9万亿为合成数据。该数据库旨在解决现有公开数据库在规模和质量上的局限性,有助于推动大语言模型的训练。Nemotron-CC基于Common Crawl网站数据构建,经过严格处理流程形成高质量子集Nemotron-CC-HQ。与现有领先数据库DCLM相比,使用Nemotron-CC-HQ训练的模型在MMLU基准测试中得分提高5.6分。此外,Nemotron-CC训练的80亿参数模型在多个基准测试中均有显著提升。英伟达表示,Nemotron-CC已公开在Common Crawl网站上。

原文链接
本文链接:https://kx.umi6.com/article/11611.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华尔街缘何愈发看涨英伟达?除AI需求“爆棚”外,还与中国市场有关
2025-08-19 16:11:00
天空才是极限?英伟达市值有望在五年内翻倍,原因是……
2025-08-20 10:14:29
英伟达CEO黄仁勋拟再减持7.5万股公司股票
2025-07-17 09:17:19
马斯克xAI挖走何宜晖:英伟达顶级工程师,西安交大校友
2025-07-23 15:52:34
英伟达黄仁勋:人工智能下一个浪潮是物理 AI
2025-07-17 12:21:44
英伟达专为机器人设计的计算平台Jetson AGX Thor量产上市
2025-08-25 23:38:42
CoreWeave高调宣布新建AI数据中心,投资总额高达60亿美元
2025-07-15 23:52:27
黄仁勋子女成长路径曝光:一个学烘焙一个开酒吧,从基层做到英伟达高管
2025-08-12 14:17:38
英伟达的增长战车,只有一个轮子
2025-08-28 20:28:21
当黄仁勋换上唐装
2025-07-17 10:20:04
黄仁勋向特朗普呼吁:美国科技公司不能被排除出中国市场
2025-08-28 12:21:12
英伟达CEO黄仁勋:正在与小米共同开发人工智能、自动驾驶软件 还有很多项目正在合作
2025-07-21 15:18:28
英伟达伙伴,1600亿的胜宏科技又去IPO了
2025-07-30 17:49:09
24小时热文
更多
扫一扫体验小程序