开源大模型新王干翻GPT-4o，新技术可纠正自己幻觉，数学99.2分刷爆测试集

2024-09-06 16:06:38

LunarCoder

发布在

快讯

阅读：522

开源大模型领域迎来新突破，一家小创业团队研发的名为Reflection 70B的模型在数学测试GSM8K上取得99.2%的高分，一举超越包括GPT-4在内的诸多顶级模型，刷新了业界记录。这项创新在于Reflection 70B采用了全新的训练技术，使其能够在推理过程中识别并纠正自身的错误和幻觉，展现出极高的自我反思能力。这一成果不仅证明了开源模型在性能上的竞争力，也预示着未来AI模型在自我纠错方面的潜力。 Reflection 70B的开发者Hyperbolic Labs已经公布了该模型的权重，并计划于下周发布更大的版本Reflection 405B，预计性能将显著超越当前的顶尖模型Sonnet和GPT-4o。此消息在社区引发广泛关注，不仅因为模型的高分成绩，还因为开源模式使得最强的AI技术能够在本地运行，降低了使用门槛。网友测试显示，Reflection 70B在处理各种数学问题及生造词数量方面表现出色，展现了其强大的理解和推理能力。作为一家由连续创业者Mutt Shumer领导的小团队，Hyperbolic Labs凭借其在AI领域的创新精神和深厚技术积累，成功地推动了开源大模型的发展。此项目不仅展示了AI技术的最新进展，也为开源社区带来了新的活力和希望，预示着未来AI技术更广泛的应用和更深入的探索。

原文链接

本文链接：https://kx.umi6.com/article/5982.html

转载请注明文章出处

Reflection 70B