“最强开源模型”Reflection 被打假，英伟达科学家称现有测试基准已不靠谱

2024-09-15 12:58:37

发布在

快讯

阅读：284

"最强开源模型"Reflection遭质疑造假风波，仅发布一周即面临多重挑战。最初，官方宣称的成绩在第三方测试中大打折扣，模型还被指责存在套壳Claude的嫌疑。随后，厂商CEO发布道歉声明，但否认造假，表示正在调查原因。质疑焦点包括成绩的可靠性、是否存在套壳行为及版本混淆等问题。同时，英伟达科学家Jim Fan指出，当前的基准测试体系存在缺陷，容易被模型造假。此次事件凸显了大模型测试标准与方法的紧迫性改革需求。

原文链接

本文链接：https://kx.umi6.com/article/6304.html

转载请注明文章出处

Reflection