卡帕西大模型横评方法太好玩！四大AI匿名参赛评分，最强出乎意料

2025-11-23 14:08:11

心智奇点

发布在

快讯

阅读：1036

11月23日，前特斯拉AI总监卡帕西发布了一款名为“大模型议会”（LLM Council）的趣味编程项目。该系统通过调用GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5和Grok-4等四大AI模型，匿名回答用户问题并互相评分排序，最终由主席模型汇总答案。实验结果显示，GPT-5.1被其他模型一致评为最强，而Claude被认为最弱。卡帕西指出，尽管模型自评与人类主观评价存在差异，但多模型集成方式展现了未来LLM产品的潜力。该项目已在GitHub收获1.8k Stars，引发广泛关注。

原文链接

本文链接：https://kx.umi6.com/article/28957.html

转载请注明文章出处

匿名互评