5月28日,权威机构SuperCLUE发布的《中文大模型基准测评2025年5月报告》显示,豆包1.5(Doubao-1.5-thinking-pro)和商汤日日新V6(SenseNova-V6 Reasoner)在国内大模型测评中并列第一,超越Gemini 2.5 Flash Preview。该测评涵盖六大任务,总计1579道多轮简答题。报告指出,国产大模型在中文领域通用能力的竞争格局逐渐明朗,Doubao-1.5-thinking-pro与SenseNova V6 Reasoner表现突出。位居第二梯队的包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1及DeepSeek-V3。SuperCLUE作为行业权威测评基准,其报告反映了国内外大模型技术差距的逐步缩小。
原文链接
本文链接:https://kx.umi6.com/article/19518.html
转载请注明文章出处
相关推荐
换一换
中信建投通信及人工智能中期策略:大模型持续迭代 算力需求强劲增长
2026-05-13 09:05:16
豆包们,开始「上链接」
2025-10-27 10:54:08
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
2026-03-27 23:23:11
ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026
2025-12-12 14:53:17
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
1300000000000000!谷歌每月Tokens消耗量曝光(别数了是千万亿)
2025-10-11 09:26:13
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
721 文章
616090 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41