标题:一个传统技术助力国产视觉基础模型脱颖而出
国产AI在视觉基础模型领域取得重要进展,格灵深瞳推出的Glint-MVT成为亮点。这项技术通过引入间隔Softmax损失函数,显著提升了模型的泛化能力和抗噪性能。测试显示,Glint-MVT在线性探测中的平均准确率高于OpenCLIP 2.3%,优于CLIP 1.1%。
Glint-MVT的核心是Margin-based pretrained Vision Transformer(MVT),它不仅在图像分割任务中表现出色,还能精准识别复杂场景下的细节。例如,在处理遮挡严重的人物图像时,AI能够精确分割出目标人物。在视频分割任务中,无论是动态变化还是静态场景,Glint-MVT均能稳定输出高质量结果。
此外,团队还开发了基于Glint-MVT的多模态模型,包括Glint-RefSeg和MVT-VLM。前者可实现无需额外训练即可分割多种物体,后者则能在图像理解任务中识别复杂信息,如运动员性别、服装颜色及号码等。
技术突破的背后,是格灵深瞳对传统方法的创新应用和对数据处理方式的优化。团队通过虚拟类别构造和噪声抑制策略,大幅提升了模型效率与准确性。这种务实的研发逻辑使Glint-MVT不仅在学术指标上领先,更在实际应用场景中展现出强大潜力。
格灵深瞳的成功离不开其专注业务需求、坚持开源共享的企业文化。从早期安防领域的探索,到如今聚焦视觉大模型,该公司始终致力于解决产业痛点。未来,格灵深瞳将继续推进多模态大模型和视频理解技术的研究,为AI落地提供更多可能。
原文链接
本文链接:https://kx.umi6.com/article/19132.html
转载请注明文章出处
相关推荐
换一换
赵勇卸任格灵深瞳CEO:创业一瞬间,跌宕十一年
2024-12-06 12:22:11
AI 公司格灵深瞳总经理赵勇辞职:第三季度亏损同比扩大两倍
2024-11-27 09:47:16
国产AI视频产品在海外杀疯了!
2024-10-23 14:38:34
DeepSeek的节后效应,国产AI生态加速闭环
2025-02-05 07:57:54
比偶然更好的事情是必然
2025-02-01 14:27:09
视觉模型底座超越OpenAI,格灵深瞳开启多模态落地的Scaling Law
2024-09-10 19:10:01
格灵深瞳:大模型是核心技术发展方向 何时扭亏成投资者关注话题|直击股东会
2024-08-21 10:32:00
国产 AI 视频第一梯队比拼!让 Sora 翻车的动作,可灵们能做好吗
2024-12-25 15:08:23
中信证券:豆包生态加速繁荣 看好国产AI产业链
2024-12-20 09:27:50
十分罕见!“科创板AI第一股”格灵深瞳创始人兼实控人赵勇辞职,助理升任CEO
2024-11-26 09:25:41
打开星际之门:美国5000亿投入AI意味着什么
2025-01-23 17:24:33
今年贺岁档电影AI起来了!《唐探1900》还没上线,AI大模型让它先火了一把
2025-01-26 16:13:07
访问量激增!国产AI视频产品在海外杀疯了
2024-10-22 17:10:59
532 文章
251247 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35