1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

谢赛宁李飞飞LeCun搞的寒武纪,究竟是个啥?

“寒武纪”在AI圈备受关注,由谢赛宁牵头,李飞飞和Yann LeCun支持的这一项目聚焦于让人工智能真正学会感知世界。其核心成果是一款多模态视频大模型Cambrian-S,主打空间感知能力,同时具备通用视频和图像理解能力,在短视频空间推理任务中达到SOTA(当前最佳)。

团队从Cambrian-1开始探索,系统测评了20多种视觉编码器,设计了高效整合视觉特征的空间视觉聚合器(SVA),并构建了700万条高质量训练数据集,推出CV-Bench基准测试以弥补现有评估不足。他们还总结出两阶段训练等提升性能的最佳方案。

然而,团队并未急于扩大规模,而是反思“什么是真正的多模态智能”。他们提出“超感知”概念,强调AI不仅要看图识物,还要理解物体间的关系及动态变化。基于此,团队将重点转向视频领域,开发出视频空间超感知技术,使AI能从连续画面中理解空间关系,例如人与物体的位置变化。

为验证和训练模型,团队设计了VSI-SUPER基准测试,包含长时程空间记忆和持续计数任务,发现主流模型在处理超长视频时表现欠佳。随后,他们创建了VSI-590K数据集,涵盖真实和模拟场景,标注了关键空间信息。最终推出的Cambrian-S模型家族参数规模虽仅0.5B至7B,但针对性极强,通过预测下一帧内容实现高效空间理解,并显著降低GPU内存消耗。

团队成员包括纽约大学博士生Shusheng Yang、香港大学博士后Jihan Yang、本科生黄品志以及Ellis Brown等,均在多模态AI领域有深厚积累。

参考链接:
[1] https://cambrian-mllm.github.io/
[2] https://x.com/sainingxie/status/1986685063367434557

原文链接
本文链接:https://kx.umi6.com/article/29003.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国AI芯片首富,干出5000亿公司
2025-09-11 08:52:18
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
2025-09-29 21:16:07
百度发布文心大模型 4.5 Turbo / X1 Turbo:主打多模态、强推理、低成本
2025-04-25 11:06:03
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
2025-05-08 20:39:27
实测字节扣子空间:AI 播客比真人丝滑,Agent 能打 80% 的工
2025-05-30 15:54:58
中信证券:AI产业端Agent和多模态两大主线有望持续引领
2025-08-01 09:26:15
高盛上调寒武纪目标价50%至1835元
2025-08-25 10:29:41
英伟达向左,寒武纪向右
2025-10-23 07:58:12
美团发布并开源 LongCat-Flash-Omni 模型:支持实时音视频交互,达到 SOTA 水平
2025-11-03 11:17:00
商汤坐上大模型核心牌桌
2025-05-09 11:48:13
别听模型厂商的,“提示”不是功能,是bug
2025-08-10 10:44:56
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
2025-08-01 09:07:26
一手实测!文心X1/4.5 Turbo推理和多模态双双变强,还把模型成本降了6成?!
2025-04-25 18:17:24
24小时热文
更多
扫一扫体验小程序