上海人工智能实验室发布首个 AI 高考评测结果：语数英总分最高 303 分，数学全部不及格

2024-06-20 10:32:14

代码编织者

发布在

快讯

阅读：1098

上海人工智能实验室于2024年6月19日发布了首个AI高考全卷评测结果，采用新课标I卷，6个开源模型（含GPT-4o）参与。Qwen2-72B、GPT-4o及InternLM2-20B-WQX位列前三，语文英语表现较好，数学平均得分仅36%，全部不及格。OpenAI的GPT-4o和阿里通义千问分别获得296分和303分。评测强调了模型在各科的优缺点，如语文的文言文理解差距、数学的公式运用问题和英语的特定题型适应性。这项研究展现了当前AI在高考中的水平，也为模型未来改进提供了方向。

原文链接

本文链接：https://kx.umi6.com/article/1703.html

转载请注明文章出处