1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月8日,深度求索(DeepSeek)联合清华大学发布AI对齐新技术SPCT,通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构,大幅减少人工标注需求及能耗。测试显示,270亿参数的DeepSeek-GRM模型成本仅1.2万美元,MT-Bench得分8.35,媲美GPT-4o。相较3400亿参数的Nemotron-4(120万美元)和1.8万亿参数的GPT-4o(630万美元),DeepSeek-GRM成本仅为其1/525,能耗降低73%,为实时机器人控制等场景提供新思路。

原文链接
本文链接:https://kx.umi6.com/article/16831.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
2025-09-18 14:54:07
AI味,越来越让人受不了了
2025-06-30 17:46:15
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
黄仁勋:DeepSeek、阿里、腾讯推动AI创新
2025-07-16 16:08:35
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
2025-07-31 09:00:51
大模型退火之后,AI手机还好吗
2025-06-25 08:26:26
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
半年不到 DeepSeek真已跌落神坛吗!我看未必 深扒背后原因
2025-07-24 13:06:29
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
24小时热文
更多
扫一扫体验小程序