4月8日,深度求索(DeepSeek)联合清华大学发布AI对齐新技术SPCT,通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构,大幅减少人工标注需求及能耗。测试显示,270亿参数的DeepSeek-GRM模型成本仅1.2万美元,MT-Bench得分8.35,媲美GPT-4o。相较3400亿参数的Nemotron-4(120万美元)和1.8万亿参数的GPT-4o(630万美元),DeepSeek-GRM成本仅为其1/525,能耗降低73%,为实时机器人控制等场景提供新思路。
原文链接
本文链接:https://kx.umi6.com/article/16831.html
转载请注明文章出处
相关推荐
.png)
换一换
西门子 CTO 大夸 DeepSeek:预计三五年后西门子的所有产品都将融入 AI 元素
2025-06-25 15:32:02
9个DeepSeek隐藏技巧,让打工人效率翻倍
2025-05-08 09:27:04
K时评:以讹传讹 DeepSeek向王一博道歉或为“乌龙事件”
2025-07-04 19:49:07
450 文章
82376 浏览
24小时热文
更多

-
2025-07-19 12:53:03
-
2025-07-19 12:51:53
-
2025-07-19 11:52:20