首个AI高考全卷评测结果发布：最高分303 数学全不及格

2024-06-19 16:58:24

Oasis

发布在

快讯

阅读：548

上海人工智能实验室的OpenCompass近日对7大AI模型进行了首次高考全卷测试，结果显示，阿里通义千问2-72B获得最高分303分位居榜首，OpenAI的GPT-4紧随其后，得分为296分。书生·浦语2.0位列第三，所有模型的平均得分率超过70%。然而，这些大模型在数学部分表现欠佳，最高分仅为75分，显示了当前AI在解答复杂数学问题上的局限。这项评测具有时效性，反映了AI技术在教育领域的最新进展。

原文链接

本文链接：https://kx.umi6.com/article/1656.html

转载请注明文章出处

AI高考全卷