综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:DeepSeek-V3为何爆火?
近期,DeepSeek-V3在国外迅速走红,主要原因有三:出色的性能、较低的训练成本及开源特性。
性能出色:在多项测试中,DeepSeek-V3超越了GPT-4o和Claude 3.5 Sonnet,尤其在数学和代码生成方面表现突出。
成本低廉:仅需600万美...
原文链接
**摘要:**
11月12日,财联社报道指出,当前AI领域“越大越好”的路径面临瓶颈。OpenAI等公司正探索新的训练技术,以突破现有局限。OpenAI联合创始人Ilya Sutskever表示,单纯扩大预训练规模已难以显著提升模型性能。目前,大模型训练需耗费大量算力和数据,成本高昂且耗时。为应对这些挑战,研究人员正关注于测试时计算技术,即在推理阶段增强模型表现,使其在面对复杂任务时更具优势。OpenAI已在新模型“o1”中采用此技术,同时Anthropic、xAI和DeepMind等公司也在研发类似技术。这些创新有望重塑AI领域的竞争格局,并对所需资源产生深远影响。
(249字)
原文链接
加载更多
暂无内容