上海人工智能实验室于2024年6月19日发布了首个AI高考全卷评测结果,采用新课标I卷,6个开源模型(含GPT-4o)参与。Qwen2-72B、GPT-4o及InternLM2-20B-WQX位列前三,语文英语表现较好,数学平均得分仅36%,全部不及格。OpenAI的GPT-4o和阿里通义千问分别获得296分和303分。评测强调了模型在各科的优缺点,如语文的文言文理解差距、数学的公式运用问题和英语的特定题型适应性。这项研究展现了当前AI在高考中的水平,也为模型未来改进提供了方向。
原文链接
本文链接:https://kx.umi6.com/article/1703.html
转载请注明文章出处
相关推荐
换一换
AI助力无人车“驶入”物流主战场:从“价格战”到“降本增效”
2025-10-27 20:16:07
亚马逊力推 AI 遭超千名员工联署反对:越帮越忙,还带来更多工作量
2025-11-28 22:50:23
CoreWeave:算力时代,手握「金铲铲」
2025-10-11 09:31:07
AI把PC天花板打破了
2025-11-23 14:07:04
AI之王大到不能倒 NVIDIA已能决定美国GDP涨跌
2025-09-25 23:14:59
苹果为什么还能赢?
2025-11-03 12:18:58
英伟达 CEO 黄仁勋:AI 不会直接“抢”走你的饭碗,而是会催生一些奇怪职业
2025-12-04 22:48:39
AI正在改写地图APP!这一次轮到谷歌了
2025-10-21 08:20:12
微软 AI CEO 苏莱曼:未来的 AI 恐将需要“军事级干预”才能控制
2025-09-25 20:11:53
黄仁勋承诺不会因AI裁员 鼓励员工积极拥抱AI
2025-11-26 07:29:29
Meta 深化与 Arm 战略合作,AI 排名和推荐系统将使用 Neoverse IP 芯片
2025-10-16 09:49:47
Meta「缅北化」?
2025-11-13 10:54:30
马斯克:AI 将像超音速海啸一样,迅速取代数字导向型办公室工作
2025-11-08 18:53:01
581 文章
342470 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52