4月8日,深度求索(DeepSeek)联合清华大学发布AI对齐新技术SPCT,通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构,大幅减少人工标注需求及能耗。测试显示,270亿参数的DeepSeek-GRM模型成本仅1.2万美元,MT-Bench得分8.35,媲美GPT-4o。相较3400亿参数的Nemotron-4(120万美元)和1.8万亿参数的GPT-4o(630万美元),DeepSeek-GRM成本仅为其1/525,能耗降低73%,为实时机器人控制等场景提供新思路。
原文链接
本文链接:https://kx.umi6.com/article/16831.html
转载请注明文章出处
相关推荐
.png)
换一换
9个DeepSeek隐藏技巧,让打工人效率翻倍
2025-05-08 09:27:04
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
2025-05-30 21:55:28
R2来之前,DeepSeek又放了个烟雾弹
2025-05-16 13:58:25
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
DeepSeek真的不行了吗
2025-07-29 19:35:17
DeepSeek核心高管离职创业,瞄准Agent赛道|独家
2025-06-09 16:30:51
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
调查 | 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎
2025-08-04 11:56:14
俩人拼出40万的Mac Studio“缝合怪”,双开满血DeepSeek 都不在话下
2025-08-09 11:28:33
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
百度李彦宏:如果没有应用,DeepSeek等 AI 模型和芯片都没有价值
2025-04-25 12:07:38
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
508 文章
188982 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25