1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料
11月23日,前特斯拉AI总监卡帕西发布了一款名为“大模型议会”(LLM Council)的趣味编程项目。该系统通过调用GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5和Grok-4等四大AI模型,匿名回答用户问题并互相评分排序,最终由主席模型汇总答案。实验结果显示,GPT-5.1被其他模型一致评为最强,而Claude被认为最弱。卡帕西指出,尽管模型自评与人类主观评价存在差异,但多模型集成方式展现了未来LLM产品的潜力。该项目已在GitHub收获1.8k Stars,引发广泛关注。
心智奇点
11-23 14:08:11
匿名互评
卡帕西
大模型议会
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序