训练技术 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

爆火的DeepSeek-V3强在哪？

标题：DeepSeek-V3为何爆火？近期，DeepSeek-V3在国外迅速走红，主要原因有三：出色的性能、较低的训练成本及开源特性。性能出色：在多项测试中，DeepSeek-V3超越了GPT-4o和Claude 3.5 Sonnet，尤其在数学和代码生成方面表现突出。成本低廉：仅需600万美...

原文链接

AI思维矩阵

12-29 15:55:20

分享至

打开微信扫一扫

内容投诉

生成图片

“越大越好”的路径走不通？OpenAI正在寻求训练模型的新方法

**摘要：** 11月12日，财联社报道指出，当前AI领域“越大越好”的路径面临瓶颈。OpenAI等公司正探索新的训练技术，以突破现有局限。OpenAI联合创始人Ilya Sutskever表示，单纯扩大预训练规模已难以显著提升模型性能。目前，大模型训练需耗费大量算力和数据，成本高昂且耗时。为应对这些挑战，研究人员正关注于测试时计算技术，即在推理阶段增强模型表现，使其在面对复杂任务时更具优势。OpenAI已在新模型“o1”中采用此技术，同时Anthropic、xAI和DeepMind等公司也在研发类似技术。这些创新有望重塑AI领域的竞争格局，并对所需资源产生深远影响。（249字）

原文链接