1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。

原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
国产大模型「五强争霸」,决战AGI!
2025-05-13 13:50:50
字节旗下 AI 豆包上线未成年人保护模式
2025-08-26 16:49:28
消息称豆包日活已破 1 亿,系字节“亿级 App”产品中花费最低
2025-12-24 20:58:04
国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?
2025-01-21 09:32:52
OpenAI断供,国产大模型百亿市场纷争再起
2024-07-03 14:01:57
国产大模型高考出分了:裸分683,选清华还是北大?
2025-06-26 15:23:08
抖音回应接入豆包:相关能力测试中
2025-03-05 08:56:17
豆包内测字节跳动自研深度思考模型,并非接入 DeepSeek
2025-02-25 17:00:32
中国AIGC APP月活用户破亿大关!字节豆包一枝独秀占据半壁江山
2025-01-20 19:22:35
入口之争重开:阿里为什么急着扶正「千问」
2025-11-18 12:14:10
「基模五强」崛起:谁将主导中国大模型终 极之战?
2025-05-19 09:12:48
用完这次更新的豆包 我想把PS卸了
2024-11-12 00:48:20
豆包宣布AI编程功能再升级
2025-03-19 13:37:39
24小时热文
更多
扫一扫体验小程序