
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
上海人工智能实验室的OpenCompass近日对7大AI模型进行了首次高考全卷测试,结果显示,阿里通义千问2-72B获得最高分303分位居榜首,OpenAI的GPT-4紧随其后,得分为296分。书生·浦语2.0位列第三,所有模型的平均得分率超过70%。然而,这些大模型在数学部分表现欠佳,最高分仅为75分,显示了当前AI在解答复杂数学问题上的局限。这项评测具有时效性,反映了AI技术在教育领域的最新进展。
原文链接
加载更多

暂无内容