近日,字节跳动Seed团队发布大模型高考评测结果。在采用山东省高考试卷的测试中,豆包文科总分683分排名第一,理科648分排名第二;Gemini理科总分655分位列第一。评测采用全国一卷和山东卷,通过API测试模拟高考环境,确保公平性。豆包在多个科目中表现优异,但语文写作存在不足。若按赋分规则计算,其总分有望冲刺清华、北大。此外,豆包和Gemini在印度JEE Advanced考试中也表现出色,具备进入全印前十的实力。
原文链接
本文链接:https://kx.umi6.com/article/20869.html
转载请注明文章出处
相关推荐
.png)
换一换
我国大模型数量超1500个
2025-07-27 23:04:18
字节旗下 AI 豆包上线未成年人保护模式
2025-08-26 16:49:28
2025大模型半年回顾:模型速度变缓
2025-06-25 19:34:48
智谱旗舰模型GLM-4.5重磅发布 相关企业有望站上风口
2025-07-29 08:27:00
大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」
2025-06-20 18:02:43
对话清华大学张亚勤:智能体是大模型时代的APP
2025-06-23 08:29:04
大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
2025-06-27 15:08:34
我国大模型数量居全球首位,达到 1509 个、占比达 40%
2025-07-27 13:57:47
亚马逊云科技大中华区总裁储瑞松:Agentic AI处于爆发前夜
2025-06-19 10:49:07
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
2025-06-21 15:10:12
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
494 文章
184452 浏览
24小时热文
更多

-
2025-09-06 22:39:24
-
2025-09-06 21:38:26
-
2025-09-06 20:38:03