"最强开源模型"Reflection遭质疑造假风波,仅发布一周即面临多重挑战。最初,官方宣称的成绩在第三方测试中大打折扣,模型还被指责存在套壳Claude的嫌疑。随后,厂商CEO发布道歉声明,但否认造假,表示正在调查原因。质疑焦点包括成绩的可靠性、是否存在套壳行为及版本混淆等问题。同时,英伟达科学家Jim Fan指出,当前的基准测试体系存在缺陷,容易被模型造假。此次事件凸显了大模型测试标准与方法的紧迫性改革需求。
原文链接
本文链接:https://kx.umi6.com/article/6304.html
转载请注明文章出处
相关推荐
换一换
9.9万起,宇树人形机器人量产了!360°起跳秀操作,英伟达科学家:想要
2024-08-20 17:40:25
“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱
2024-09-15 12:58:37
英伟达宣布正与优步合作推进自动驾驶汽车研发
2025-10-24 09:34:47
越帮越忙?EA 等公司员工称内部正大力推广 AI,实际却让工作更烦琐
2025-10-24 15:42:18
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
快手进军AICoding赛道
2025-10-23 16:11:06
谷歌放大招!Gemini「吞下」2.5亿地图数据,路痴AI一夜成精
2025-10-24 11:33:27
OpenAI收购由前苹果员工创立的人工智能初创公司
2025-10-24 01:20:07
全球最薄仿生视触觉传感器亮相IROS 2025,一目科技引领机器人“触觉革命”
2025-10-23 15:08:17
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
2025-10-24 09:29:01
上海新增2款已完成备案的生成式人工智能服务
2025-10-23 19:13:44
AMD 确认 Radeon AI PRO R9700 32GB 显卡 10 月 27 日零售上市,1299 美元起
2025-10-24 08:28:19
阿里巴巴将开启夸克AI眼镜预售 推动人工智能应用商业化
2025-10-23 13:08:00
543 文章
267008 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50