上海人工智能实验室于2024年6月19日发布了首个AI高考全卷评测结果,采用新课标I卷,6个开源模型(含GPT-4o)参与。Qwen2-72B、GPT-4o及InternLM2-20B-WQX位列前三,语文英语表现较好,数学平均得分仅36%,全部不及格。OpenAI的GPT-4o和阿里通义千问分别获得296分和303分。评测强调了模型在各科的优缺点,如语文的文言文理解差距、数学的公式运用问题和英语的特定题型适应性。这项研究展现了当前AI在高考中的水平,也为模型未来改进提供了方向。
原文链接
本文链接:https://kx.umi6.com/article/1703.html
转载请注明文章出处
相关推荐
.png)
换一换
2025科技股IPO:Figma的逆袭与不成熟的AI故事
2025-07-16 17:06:58
美知名投资人马克・库班大胆预测:AI 将造就全球首位万亿富翁
2025-07-07 17:36:58
大厂AI,还干不掉张雪峰
2025-06-19 10:46:51
413 文章
66932 浏览
24小时热文
更多

-
2025-07-20 08:01:35
-
2025-07-19 22:57:32
-
2025-07-19 21:58:20