上海人工智能实验室于2024年6月19日发布了首个AI高考全卷评测结果,采用新课标I卷,6个开源模型(含GPT-4o)参与。Qwen2-72B、GPT-4o及InternLM2-20B-WQX位列前三,语文英语表现较好,数学平均得分仅36%,全部不及格。OpenAI的GPT-4o和阿里通义千问分别获得296分和303分。评测强调了模型在各科的优缺点,如语文的文言文理解差距、数学的公式运用问题和英语的特定题型适应性。这项研究展现了当前AI在高考中的水平,也为模型未来改进提供了方向。
原文链接
本文链接:https://kx.umi6.com/article/1703.html
转载请注明文章出处
相关推荐
换一换
AI 重塑人力格局,摩根士丹利预计欧洲银行到 2030 年将裁员 20 万人
2026-01-02 16:21:51
黄仁勋发Token当工资!硅谷兴起刷量大赛,一人烧掉33个维基百科
2026-03-23 12:09:35
AI引爆存储芯片涨价潮 三星Q4营业利润有望飙升160%
2026-01-06 17:21:27
2025年AI期末考试,谷歌又考了全年级第一
2026-02-07 09:50:11
算力,终于像电一样被「发明」出来了
2026-01-14 11:33:54
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
时薪 3500,4 万人抢着给 AI 打工
2026-02-06 03:30:07
瑞银:AI对各行业存在颠覆性变革 市场尚未完全消化这一风险
2026-02-13 16:30:45
AI做日本高考题9科得满分
2026-01-20 22:34:54
中信建投:预计由AI等带来的光纤需求将持续较快增长
2026-01-29 08:05:48
用一个字,证明你不是 AI
2026-01-02 17:25:05
联想杨元庆:AI没有任何泡沫 是不能停止的大趋势
2026-02-12 20:43:16
离家50米远 是走着去还是开车去?洗车问题难倒一众AI
2026-02-11 09:09:15
673 文章
544177 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57