5月28日,权威机构SuperCLUE发布的《中文大模型基准测评2025年5月报告》显示,豆包1.5(Doubao-1.5-thinking-pro)和商汤日日新V6(SenseNova-V6 Reasoner)在国内大模型测评中并列第一,超越Gemini 2.5 Flash Preview。该测评涵盖六大任务,总计1579道多轮简答题。报告指出,国产大模型在中文领域通用能力的竞争格局逐渐明朗,Doubao-1.5-thinking-pro与SenseNova V6 Reasoner表现突出。位居第二梯队的包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1及DeepSeek-V3。SuperCLUE作为行业权威测评基准,其报告反映了国内外大模型技术差距的逐步缩小。
原文链接
本文链接:https://kx.umi6.com/article/19518.html
转载请注明文章出处
相关推荐
.png)
换一换
毕马威报告:中国银行业在大模型落地应用方面走在前列
2025-06-23 16:27:32
蚂蚁集团CTO何征宇: 大模型幻觉的源头是缺乏数据
2025-05-17 15:10:06
从黑箱到显微镜:大模型可解释性的现状与未来
2025-06-17 18:41:56
449 文章
68986 浏览
24小时热文
更多

-
2025-07-19 17:56:25
-
2025-07-19 17:55:01
-
2025-07-19 16:54:40