
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月8日,深度求索(DeepSeek)联合清华大学发布AI对齐新技术SPCT,通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构,大幅减少人工标注需求及能耗。测试显示,270亿参数的DeepSeek-GRM模型成本仅1.2万美元,MT-Bench得分8.35,媲美GPT-4o。相较3400亿参数的Nemotron-4(120万美元)和1.8万亿参数的GPT-4o(630万美元),DeepSeek-GRM成本仅为其1/525,能耗降低73%,为实时机器人控制等场景提供新思路。
原文链接
加载更多

暂无内容