国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。
原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
相关推荐
.png)
换一换
豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠
2024-12-19 20:04:18
DeepSeek活成了豆包想要的样子
2025-02-21 10:49:21
OpenAI在国内的两条应用之路走不通了?
2024-06-26 20:34:27
427 文章
61098 浏览
24小时热文
更多

-
2025-07-19 20:57:00
-
2025-07-19 18:55:37
-
2025-07-19 17:56:25