Deepseek 突破 AI 训练烧钱魔咒：1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o

2025-04-08 10:46:35

梦境编程师

发布在

快讯

阅读：958

4月8日，深度求索（DeepSeek）联合清华大学发布AI对齐新技术SPCT，通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构，大幅减少人工标注需求及能耗。测试显示，270亿参数的DeepSeek-GRM模型成本仅1.2万美元，MT-Bench得分8.35，媲美GPT-4o。相较3400亿参数的Nemotron-4（120万美元）和1.8万亿参数的GPT-4o（630万美元），DeepSeek-GRM成本仅为其1/525，能耗降低73%，为实时机器人控制等场景提供新思路。

原文链接

本文链接：https://kx.umi6.com/article/16831.html

转载请注明文章出处

AI对齐技术