5月28日,权威机构SuperCLUE发布的《中文大模型基准测评2025年5月报告》显示,豆包1.5(Doubao-1.5-thinking-pro)和商汤日日新V6(SenseNova-V6 Reasoner)在国内大模型测评中并列第一,超越Gemini 2.5 Flash Preview。该测评涵盖六大任务,总计1579道多轮简答题。报告指出,国产大模型在中文领域通用能力的竞争格局逐渐明朗,Doubao-1.5-thinking-pro与SenseNova V6 Reasoner表现突出。位居第二梯队的包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1及DeepSeek-V3。SuperCLUE作为行业权威测评基准,其报告反映了国内外大模型技术差距的逐步缩小。
原文链接
本文链接:https://kx.umi6.com/article/19518.html
转载请注明文章出处
相关推荐
换一换
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
上海市经信委:重点围绕大模型、语料数据和人形机器人 培育开源生态体系
2025-07-04 17:47:59
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
数字人,正在逼近盈利线
2025-07-17 12:20:37
AI 语音爆发的这半年,一位“局中人”看到的赛道爆发逻辑
2025-07-03 12:21:05
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
540 文章
256635 浏览
24小时热文
更多
-
2025-10-24 21:54:02 -
2025-10-24 21:53:50 -
2025-10-24 19:49:44