1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月,英伟达韩松团队推出全新高效语言模型Jet-Nemotron,基于后神经架构搜索(PostNAS)技术。该模型在MMLU等基准测试中表现优异,吞吐量较Qwen3-1.7B快47倍,缓存缩小至1/47,同时在数学、常识推理、编码等任务上超越多个基线模型。研究团队通过全注意力层优化、动态卷积模块设计及硬件感知搜索提升效率,并计划开源代码与模型。团队成员均来自华人学者,包括清华大学、麻省理工学院等顶尖机构的研究人员。这一成果显著推进了高效语言模型的发展。

原文链接
本文链接:https://kx.umi6.com/article/24232.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
英伟达韩松团队新作:具有后神经架构搜索的高效语言模型
2025-08-26 19:51:52
普洛斯算力中心引入浙江国资战略股东
2025-08-26 15:50:30
马来西亚推出首款7纳米自研AI芯片MARS1000
2025-08-26 19:55:54
Github并入微软AI,是开源精神的终结吗?
2025-08-26 07:39:13
榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒
2025-08-26 14:44:18
国务院发布深入实施“人工智能+”行动的意见 到2027年新一代智能终端、智能体等应用普及率超70%
2025-08-26 17:53:31
字节豆包研发 3D 模型 AI 生成工具“3D Model Generator”
2025-08-26 09:40:00
不用AI就被淘汰?国外工程师:“10倍生产力”太荒谬了
2025-08-26 12:43:51
特斯拉机器人大转向
2025-08-26 17:49:35
粉笔事业单位AI刷题班上线,AI产品矩阵全面落地,商业化进程加速
2025-08-26 15:45:53
从争夺流量到比拼AI 腾讯、字节、阿里开启协同办公“三国杀”
2025-08-26 14:47:50
OpenAI会走向Google的商业化之路吗?
2025-08-26 14:45:28
特斯拉机器人大转向:训练需求至少是汽车的10倍
2025-08-26 15:48:33
24小时热文
更多
扫一扫体验小程序