1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月28日,权威机构SuperCLUE发布的《中文大模型基准测评2025年5月报告》显示,豆包1.5(Doubao-1.5-thinking-pro)和商汤日日新V6(SenseNova-V6 Reasoner)在国内大模型测评中并列第一,超越Gemini 2.5 Flash Preview。该测评涵盖六大任务,总计1579道多轮简答题。报告指出,国产大模型在中文领域通用能力的竞争格局逐渐明朗,Doubao-1.5-thinking-pro与SenseNova V6 Reasoner表现突出。位居第二梯队的包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1及DeepSeek-V3。SuperCLUE作为行业权威测评基准,其报告反映了国内外大模型技术差距的逐步缩小。

原文链接
本文链接:https://kx.umi6.com/article/19518.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
训练大模型烧了那么多钱,商业价值到底在哪?
2025-07-04 09:39:31
特想聊聊快手这次的变化
2025-06-25 08:43:51
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
商汤需要「网感」
2025-07-09 13:03:03
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到
2025-07-27 21:02:57
如何避免成为AI墓地的一员?
2025-07-23 13:50:51
上海出台17条措施促进软信业发展 优质大模型应用最高给予30%补助
2025-07-07 20:36:05
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
从黑箱到显微镜:大模型可解释性的现状与未来
2025-06-17 18:41:56
独家|阶跃星辰正进行新一轮融资 金额超5亿美元
2025-07-25 22:31:59
24小时热文
更多
扫一扫体验小程序