数学不及格 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

首个AI高考全卷评测结果发布：最高分303 数学全不及格

上海人工智能实验室的OpenCompass近日对7大AI模型进行了首次高考全卷测试，结果显示，阿里通义千问2-72B获得最高分303分位居榜首，OpenAI的GPT-4紧随其后，得分为296分。书生·浦语2.0位列第三，所有模型的平均得分率超过70%。然而，这些大模型在数学部分表现欠佳，最高分仅为75分，显示了当前AI在解答复杂数学问题上的局限。这项评测具有时效性，反映了AI技术在教育领域的最新进展。

原文链接