国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。
原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
相关推荐
换一换
智动力:产品可用于AI手机 尚未与豆包合作
2025-12-03 11:15:01
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
国产4o大模型,秒懂国风李子柒
2024-11-20 14:09:53
豆包文科成绩超了一本线,为什么理科不行?
2024-07-02 14:30:06
用完这次更新的豆包 我想把PS卸了
2024-11-12 00:48:20
把“豆包”装进AI超级框 阿里夸克“C计划”首个成果曝光!
2025-10-23 13:05:54
豆包上线“深入研究”功能:快速、全面地处理高难度的复杂任务
2025-06-30 14:44:10
从豆包到 Kimi,为什么 AI 产品都在做浏览器插件
2024-07-17 20:49:30
豆包大模型 1.6 正式发布,每百万输入 Token 低至 0.8 元
2025-06-11 12:09:27
豆包如何坐上流量王座?张一鸣“大力出奇迹” 原来全球AI都在“卷”投放
2024-12-14 09:43:34
国产大模型“考研数学”成绩单出炉,哪家AI能上岸?
2025-01-14 20:18:21
豆包语音对话功能更新,能讲4种地道方言,具备思考能力
2025-11-28 13:27:01
豆包上线音乐生成 用户可一键生成词曲
2024-08-13 12:01:42
575 文章
321392 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57