国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。
原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
相关推荐
换一换
豆包已接入抖音电商 内测AI购物
2026-03-30 14:54:23
豆包语音对话功能更新,能讲4种地道方言,具备思考能力
2025-11-28 13:27:01
豆包视频生成模型Seedance 2.0上线
2026-02-12 13:23:21
豆包、千问与Kimi,站在AI Agent的岔路口
2026-01-21 08:59:27
豆包上线音乐生成 用户可一键生成词曲
2024-08-13 12:01:42
消息称豆包日活已破 1 亿,系字节“亿级 App”产品中花费最低
2025-12-24 20:58:04
千问成全球第三大AI应用:月活达2.03亿 增速552%居首
2026-03-03 18:22:01
微博 CEO 王高飞回应能否让 AI 手机自己发微博:需要确认
2025-12-08 09:17:44
豆包将在免费模式外新增付费订阅 官方回应
2026-05-04 13:23:47
豆包上线视频通话功能 支持实时视频问答
2025-05-23 17:46:42
用完这次更新的豆包 我想把PS卸了
2024-11-12 00:48:20
百度文心助手月活用户数突破 2 亿,与豆包 / 千问形成中国三大亿级 AI 入口
2026-01-20 17:20:02
国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?
2025-01-21 09:32:52
708 文章
608753 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13