AI对齐技术 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Deepseek 突破 AI 训练烧钱魔咒：1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o

4月8日，深度求索（DeepSeek）联合清华大学发布AI对齐新技术SPCT，通过推理阶段动态优化显著降低训练成本。SPCT采用“原则合成-响应生成-批判过滤-原则优化”递归架构，大幅减少人工标注需求及能耗。测试显示，270亿参数的DeepSeek-GRM模型成本仅1.2万美元，MT-Bench得分8.35，媲美GPT-4o。相较3400亿参数的Nemotron-4（120万美元）和1.8万亿参数的GPT-4o（630万美元），DeepSeek-GRM成本仅为其1/525，能耗降低73%，为实时机器人控制等场景提供新思路。

原文链接