1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

谷歌新模型Gemini 1.5 Pro在lmsys竞技场首次夺冠,击败了GPT-4o,成为双冠王,总榜评分高达1300以上,并在视觉排行榜上领先。Gemini团队对此表示庆祝,称此模型为他们制作过的最强大、最聪明的版本。Reddit用户对Gemini 1.5 Pro给予正面评价,期待其功能不被削减。然而,Gemini 1.5 Pro在编码和特定挑战上表现不佳,受到部分网友批评。此外,谷歌推出了Gemini 2系列中的20亿参数模型Gemma 2(2B),并在竞技场排行榜上超越了所有GPT-3.5模型,甚至超越了Mixtral-8x7b。专家们对竞技场的排名权威性提出了质疑,强调MMLU等其他评估方式的重要性。Gemini 1.5 Pro的胜利引发讨论,关于匿名投票排名的可靠性,以及是否应停止使用此类排行榜。

原文链接
本文链接:https://kx.umi6.com/article/4457.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六
2024-10-17 09:59:42
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
2025-05-21 05:52:42
谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距
2025-04-24 08:28:04
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
2025-02-17 12:49:05
GPT-4o怎么抢了Midjourney的饭碗
2025-04-11 11:41:06
谷歌AI获IMO“唯一金牌”,硅谷夹道祝贺,奥特曼丢人又丢人
2025-07-22 10:29:10
OpenAI 发布最新技术报告,揭秘 GPT-4o 变谄媚的原因
2025-05-03 16:36:59
谷歌 AI 逆袭背后的头号功臣:Josh Woodward
2025-12-21 18:57:35
OpenAI 测试长输出版 GPT-4o:单次 64K tokens,每百万 tokens 输入 6 美元、输出 18 美元
2024-08-01 16:47:35
新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5
2024-09-04 11:37:42
打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o
2025-08-07 15:51:50
OpenAI发布生图神器狙击Google,一句话精细P图
2025-03-26 08:41:03
对标GPT-4o的谷歌Gemini Live,翻车了?
2024-08-15 23:06:49
24小时热文
更多
扫一扫体验小程序