上海人工智能实验室于2024年6月19日发布了首个AI高考全卷评测结果,采用新课标I卷,6个开源模型(含GPT-4o)参与。Qwen2-72B、GPT-4o及InternLM2-20B-WQX位列前三,语文英语表现较好,数学平均得分仅36%,全部不及格。OpenAI的GPT-4o和阿里通义千问分别获得296分和303分。评测强调了模型在各科的优缺点,如语文的文言文理解差距、数学的公式运用问题和英语的特定题型适应性。这项研究展现了当前AI在高考中的水平,也为模型未来改进提供了方向。
原文链接
本文链接:https://kx.umi6.com/article/1703.html
转载请注明文章出处
相关推荐
换一换
《古墓丽影》新作封面被质疑使用AI 官方回应
2026-06-08 21:46:02
赚翻了!小伙5个月用AI做120多个App:只需验收上架 90%都有付费用户
2026-02-14 12:16:24
AI需求井喷!台积电CEO:数年难以填满芯片缺口
2026-06-04 17:14:24
对话「哈萨比斯传」作者:“他不喜欢奥特曼”
2026-03-11 18:22:42
Token一词该怎么翻译!清华教授提议中文名为模元
2026-03-20 16:48:30
SaaS的末日已经来了?
2026-02-07 09:49:00
亚洲首富只当了三天 孙正义是时代弄潮儿还是追泡沫的人?
2026-06-04 17:16:03
最先被AI淘汰的不是员工 是公司
2026-05-05 22:45:58
有人靠CPU把AI算力密度卷到了新高度
2026-06-05 22:17:47
华泰证券:AI推动机床、工控等顺周期景气提升
2026-05-13 09:06:29
人大代表:年轻人不要和AI比效率 不是一个聪明的选择
2026-03-04 00:49:02
中信建投:重点关注AI、光模块、电网设备、人形机器人等
2026-05-17 21:58:50
Intel据悉将在5月启动第三轮调价 目标完成全年累计30%的涨幅
2026-04-03 16:11:41
708 文章
648111 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41