1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

谢赛宁李飞飞LeCun搞的寒武纪,究竟是个啥?

“寒武纪”在AI圈备受关注,由谢赛宁牵头,李飞飞和Yann LeCun支持的这一项目聚焦于让人工智能真正学会感知世界。其核心成果是一款多模态视频大模型Cambrian-S,主打空间感知能力,同时具备通用视频和图像理解能力,在短视频空间推理任务中达到SOTA(当前最佳)。

团队从Cambrian-1开始探索,系统测评了20多种视觉编码器,设计了高效整合视觉特征的空间视觉聚合器(SVA),并构建了700万条高质量训练数据集,推出CV-Bench基准测试以弥补现有评估不足。他们还总结出两阶段训练等提升性能的最佳方案。

然而,团队并未急于扩大规模,而是反思“什么是真正的多模态智能”。他们提出“超感知”概念,强调AI不仅要看图识物,还要理解物体间的关系及动态变化。基于此,团队将重点转向视频领域,开发出视频空间超感知技术,使AI能从连续画面中理解空间关系,例如人与物体的位置变化。

为验证和训练模型,团队设计了VSI-SUPER基准测试,包含长时程空间记忆和持续计数任务,发现主流模型在处理超长视频时表现欠佳。随后,他们创建了VSI-590K数据集,涵盖真实和模拟场景,标注了关键空间信息。最终推出的Cambrian-S模型家族参数规模虽仅0.5B至7B,但针对性极强,通过预测下一帧内容实现高效空间理解,并显著降低GPU内存消耗。

团队成员包括纽约大学博士生Shusheng Yang、香港大学博士后Jihan Yang、本科生黄品志以及Ellis Brown等,均在多模态AI领域有深厚积累。

参考链接:
[1] https://cambrian-mllm.github.io/
[2] https://x.com/sainingxie/status/1986685063367434557

原文链接
本文链接:https://kx.umi6.com/article/29003.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
寒武纪怎么了?
2026-02-06 03:26:41
阿里视频模型 HappyHorse 开启灰测,悟空已率先接入
2026-04-28 17:26:42
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
2025-08-05 19:18:01
寒武纪盘中跌超2% 失守1000元大关
2026-03-23 11:11:18
2个月浮盈超50万 A股“新王”寒武纪投资者晒收益
2025-08-28 19:29:28
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超Nano Banana
2025-10-31 10:25:44
定增近40亿 “国产NVIDIA“寒武纪将加码AI芯片与软件研发
2025-08-17 11:34:56
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
2025-09-30 09:26:21
字节把GPT-4o级图像生成能力开源了!
2025-05-24 16:24:01
豪赌“寒王”日赚超12亿?牛散章建平重金砸入“AI+” 此前布局这些个股
2025-08-24 12:15:37
寒武纪盘中大幅跳水 公司回应:不清楚具体原因 市场很多传闻都是假的
2026-02-03 13:38:34
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
24小时热文
更多
扫一扫体验小程序