国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。
原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
相关推荐
换一换
中国AIGC APP月活用户破亿大关!字节豆包一枝独秀占据半壁江山
2025-01-20 19:22:35
千问成全球第三大AI应用:月活达2.03亿 增速552%居首
2026-03-03 18:22:01
OpenAI断供中国,微软云却留了后手
2024-07-06 05:11:53
阿里人士回应“千问全员会标语称‘干死豆包’”:假的
2025-12-19 15:59:00
豆包语音对话功能更新,能讲4种地道方言,具备思考能力
2025-11-28 13:27:01
抖音回应接入豆包:相关能力测试中
2025-03-05 08:56:17
国产新一代大模型MiniMax 3上半年发布:多模态、全球顶级性能
2026-03-03 22:38:04
姚顺宇离职背后:国产大模型已经上桌了
2025-10-11 10:15:41
国产大模型“考研数学”成绩单出炉,哪家AI能上岸?
2025-01-14 20:18:21
用完这次更新的豆包 我想把PS卸了
2024-11-12 00:48:20
豆包内测字节跳动自研深度思考模型,并非接入 DeepSeek
2025-02-25 17:00:32
豆包P图大更新 网友们已经玩嗨了!
2025-09-09 06:08:20
苹果AI的国产大模型之争,没有悬念
2024-07-04 09:17:53
648 文章
441921 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18