Reflection 70B - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Reflection 70B AI 模型“塌房”：第三方基准测试结果不佳，不如 LLaMA-3.1-70B

科技媒体The Decoder于9月10日发布报道，指出对比平台Artificial Analysis数据显示，Reflection 70B AI模型在基准测试中的表现不如Meta的LLaMA-3.1-70B。Reflection公司CEO马特·舒默解释，上传至Hugging Face的模型权重存在问题，导致测试结果不佳。尽管内部托管的模型表现出色，但公开API的测试结果仍低于LLaMA-3.1-70B。舒默已向部分用户提供了访问内部模型的权限，以重做测试。此外，舒默透露其公司OthersideAI计划发布基于LLaMA 3.1 450B的更大、更强大的模型，声称这将是历史上最优秀的语言模型。相关阅读链接提及该模型在技术上的突破，包括纠正自身幻觉的能力和数学测试得分99.2%。

原文链接

代码编织者

09-11 12:24:53

LLaMA-3.1-70B

Reflection 70B AI模型

基准测试

分享至

打开微信扫一扫

内容投诉

生成图片

开源大模型新王 Reflection 70B 超越 GPT-4o：新技术可纠正自己幻觉，数学 99.2 分刷爆测试集

【开源大模型新王Reflection 70B横空出世】一家小型创业团队成功研发出Reflection 70B，这款模型在推理过程中能够自我反思并纠正错误，刷新数学测试得分至99.2%，全面超越包括GPT-4在内的顶级开源模型，引发AI领域巨大震动。新模型采用创新的Reflection-Tuning技术，通过在最终回应前检测和修正推理错误，显著提升了准确性。Meta主动提供额外算力支持，网友试玩体验火爆。Reflection 70B基于Llama 3.1架构，性能优越，下周将发布更大版本Reflection 405B，预计将超越Sonnet和GPT-4o。团队负责人Mutt Shumer，连续创业者，毕业于美国锡拉丘兹大学，OthersideAI联合创始人兼CEO。此成果标志着开源AI领域的重要突破，有望推动AI技术的广泛应用。

原文链接

阿达旻

09-07 00:50:30

Reflection 70B

数学99.2分

自我反思纠正错误

分享至

打开微信扫一扫

内容投诉

生成图片

超越GPT-4o，开源大模型的新王诞生了

超越GPT-4，开源大模型新王Reflection 70B横空出世，由AI写作初创公司HyperWrite推出。此模型在MMLU、MATH、IFEval、GSM8K等基准测试中全面超越GPT-4，甚至击败了405B的Llama 3.1，展现出卓越的性能。HyperWrite的CEO Matt Shu...

原文链接

智慧轨迹

09-06 21:10:10

HyperWrite

OpenAI GPT-4o

Reflection 70B

分享至

打开微信扫一扫

内容投诉

生成图片

开源大模型新王干翻GPT-4o，新技术可纠正自己幻觉，数学99.2分刷爆测试集

开源大模型领域迎来新突破，一家小创业团队研发的名为Reflection 70B的模型在数学测试GSM8K上取得99.2%的高分，一举超越包括GPT-4在内的诸多顶级模型，刷新了业界记录。这项创新在于Reflection 70B采用了全新的训练技术，使其能够在推理过程中识别并纠正自身的错误和幻觉，展现...

原文链接