近日,字节跳动Seed团队发布大模型高考评测结果。在采用山东省高考试卷的测试中,豆包文科总分683分排名第一,理科648分排名第二;Gemini理科总分655分位列第一。评测采用全国一卷和山东卷,通过API测试模拟高考环境,确保公平性。豆包在多个科目中表现优异,但语文写作存在不足。若按赋分规则计算,其总分有望冲刺清华、北大。此外,豆包和Gemini在印度JEE Advanced考试中也表现出色,具备进入全印前十的实力。
原文链接
本文链接:https://kx.umi6.com/article/20869.html
转载请注明文章出处
相关推荐
换一换
建议你不要再相信AI基准测试,排行榜已经没啥公信力了
2025-12-04 12:18:33
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
关于 AI Infra 的一切
2025-08-11 19:08:22
豆包推荐的短视频关不掉,AI正成为未成年人的“漏洞”?
2025-08-25 16:32:18
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
2025-07-28 09:07:15
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到
2025-07-27 21:02:57
智谱旗舰模型GLM-4.5重磅发布 相关企业有望站上风口
2025-07-29 08:27:00
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
大模型激战正酣!大厂节前、节中进展不停 争夺下一代操作系统主导权
2025-10-05 18:23:27
603 文章
362803 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57