标题:商汤坐上大模型核心牌桌
过去两年,关于大模型的讨论较少聚焦成立仅十年的商汤。这源于技术路径的差异:商汤以计算机视觉模型为主,而新技术浪潮以自然语言处理为核心。然而,DeepSeek R1 的发布让一切改变:语言方向的基础模型接近极限,所有厂商需选择继续卷语言模型或寻找差异化竞争。同时,用于训练语言模型的文本数据即将耗尽,多模态大模型成为新方向。
商汤凭借过去十年积累的行业经验和技术实力,在多模态大模型领域逐渐占据优势。今年4月发布的日日新SenseNova V6,参数规模达6000亿,在多模态综合能力上对标GPT-4.5和Gemini 2.0 Pro。商汤早在2024年初就在权威榜单上夺冠,成为大语言与多模态能力的“双冠王”。
商汤从2024年中开始探索原生融合的多模态大模型,其核心技术在于多模态桥接与长思维链构造。日日新V6不仅能在推理和情感共鸣上媲美顶级模型,还能支持长达10分钟的视频输入,并具备长记忆能力。
在算力优化上,商汤大装置每卡每秒可处理1600+token,且部分训练已在国产芯片上完成。推理效率方面,商汤大装置在线服务性能超行业平均水平25%,离线推理阶段提速显著。
商汤的独特优势在于其“终局思维”,即致力于推动行业AI化,而非单纯打造流量入口。基于此,商汤在大模型的商业化落地中展现出独特竞争力,尤其在To B领域表现突出。
商汤生成式AI业务收入达24亿元,占总收入63.7%,同比增长超100%。日日新V6的突破不仅提升了算法飞轮,还助力商汤在多模态大模型领域领先半步,成功坐上大模型的核心牌桌。
原文链接
本文链接:https://kx.umi6.com/article/18357.html
转载请注明文章出处
相关推荐
.png)
换一换
讯飞拍了拍Kimi 说,“起来卷”
2024-08-18 13:01:23
美日韩澳意印等国封杀DeepSeek 美国最高判20年!中国正式回应
2025-02-06 16:36:34
中美厮杀 NVIDIA GPU夹缝中涨价!全线无一例外
2025-05-13 17:02:07
430 文章
73695 浏览
24小时热文
更多

-
2025-07-19 11:52:20
-
2025-07-19 11:51:22
-
2025-07-19 10:50:54