12月2日,英伟达发布新型AI解码方法TiDAR,融合自回归与扩散模型机制,利用GPU‘空闲槽位’加速文本生成。该技术通过单步生成多个Token,大幅提升AI吞吐量,最高可达近600%。TiDAR创新性训练单一Transformer模型同时执行自回归预测和扩散并行起草,解决了早期扩散解码器的部署难题。测试显示,在HumanEval和GSM8K基准中,其准确率与基准模型持平甚至更高,15亿参数版本吞吐量提升4.71倍,80亿参数版本达5.91倍。但目前测试仅限于中小模型,未来需验证大规模模型上的实用性。
原文链接
本文链接:https://kx.umi6.com/article/29513.html
转载请注明文章出处
相关推荐
换一换
英伟达发布 TiDAR:单步生成多个 Token,AI 吞吐量提升近 600%
2025-12-02 15:19:50
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
2024-06-27 13:56:56
OpenAI的吉卜力,撞车了被字节起诉“投毒AI”的前实习生?
2025-04-03 14:24:18
李开复:未来办公司和搭积木一样快,比谁更会用 Agent
2025-12-06 18:42:35
豆包手机助手:我们无法直接查询银行卡余额,需用户授权及手动确认
2025-12-06 17:41:12
黄仁勋很发愁!就算解禁H200 AI GPU 也不知道中国要不要
2025-12-05 12:26:47
《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature
2025-12-06 11:25:22
DeepSeek V3.2爆火,Agentic性能暴涨40%解密
2025-12-05 17:41:21
华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升
2025-12-06 02:03:09
神秘模型 Grok 4.20 AI 炒股夺冠:只有它赚钱,吊打 Gemini 3 和 GPT-5.1
2025-12-07 16:36:04
腾讯发布EdgeOne Pages正式版:国内首个边缘全栈开发平台,内测阶段用户突破15万
2025-12-05 14:31:16
“AI 教母”李飞飞抨击 AI 宣传两极化:要么世界末日,要么乌托邦
2025-12-05 16:41:16
快手可灵 O1 主体库上线:只要有多角度参考图就能让 AI“记住”主角
2025-12-06 21:53:19
611 文章
368412 浏览
24小时热文
更多
-
2025-12-07 20:45:46 -
2025-12-07 18:40:26 -
2025-12-07 18:39:34