1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

国产大模型高考成绩公布,豆包以683分的文科总成绩位列第一,理科648分排名第二。Gemini理科总分655分,排名第一。评测采用山东省高考卷,主科为全国一卷,副科为山东卷,满分750分。测试通过API进行,不联网,评分方式模拟高考,包括机评、人工质检和双评制。豆包在数学、化学、生物等科目表现优异,但在语文写作中因跑题仅得95分。若按赋分规则计算,豆包有望冲刺清华、北大。评测显示,大模型在数学推理能力上显著提升,但图像理解仍存短板,如单选题全军覆没。英语写作略显单调,理综题目中图像理解能力较弱。豆包还参加了印度JEE Advanced考试,表现接近前10名。其性能提升得益于多模态融合、深度思考能力和AutoCoT技术优化,能处理长文本与复杂问题。未来全模态推理或成重要发展方向。

原文链接
本文链接:https://kx.umi6.com/article/20799.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
「基模五强」崛起:谁将主导中国大模型终 极之战?
2025-05-19 09:12:48
豆包推荐的短视频关不掉,AI正成为未成年人的“漏洞”?
2025-08-25 16:32:18
国产大模型“考研数学”成绩单出炉,哪家AI能上岸?
2025-01-14 20:18:21
OpenAI断供中国,微软云却留了后手
2024-07-06 05:11:53
豆包支持带有指定文字的图片生成,App已开启测试
2024-12-06 13:22:39
继续狂飙!豆包“全家桶”迎来重磅更新 视觉理解、视频生成功能都来了
2024-12-18 13:31:32
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025-03-07 09:52:46
字节跳动:豆包搜索来源于公开信息,与 WPS 在 AI 训练层面未开展任何形式合作
2024-07-22 17:11:09
中国AIGC APP月活破亿 豆包一家独占一半
2025-01-19 17:54:01
斯坦福AI团队承认抄袭国产大模型 开源“套壳”是与非再掀热议
2024-06-04 15:10:42
豆包内测字节跳动自研深度思考模型,并非接入 DeepSeek
2025-02-25 17:00:32
国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?
2025-01-21 09:32:52
网友称“Deepseek演都不演了”:输入手机内存不够“二选一删谁” 秒回答豆包
2025-08-20 17:26:16
24小时热文
更多
扫一扫体验小程序