2026年3月,商汤科技联合南洋理工大学发布全新多模态模型架构NEO-unify。该架构突破性地砍掉视觉编码器(VE)和变分自编码器(VAE),采用近似无损的像素与文字作为原生输入,实现‘原生、统一、端到端’的多模态处理。通过创新的混合变换器(MoT)架构,打通视觉与语言的‘理解+生成’双向能力,显著提升数据与算力利用效率。实验表明,NEO-unify在图像重建与编辑任务中表现出色,初步训练后即取得优异指标,并展现更高数据训练效率。这一成果标志着多模态AI从‘模态连接’向‘原生统一智能体’迈进,为跨模态认知与生成一体化奠定基础。相关研发正持续迭代,未来将陆续开源。
原文链接
本文链接:https://kx.umi6.com/article/33494.html
转载请注明文章出处
相关推荐
换一换
商汤坐上大模型核心牌桌
2025-05-09 11:48:13
百度:推出首个多模态高度融合数字人
2025-06-17 16:25:35
商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
2025-07-29 20:35:07
阶跃星辰与吉利联合开源,多模态实力领跑开源大模型
2025-02-18 10:15:09
全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
2025-01-16 18:59:50
财跃星辰CTO白祚:推理模型将快速迭代到Agent模型
2025-02-23 19:04:12
Llama 4发布:我看到了DeepSeek的影子
2025-04-06 16:06:56
摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
2025-03-31 17:40:22
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
美团新独立APP,点不了菜只能点AI
2025-11-03 12:17:52
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
阶跃星辰李璟:2025年将是Agent落地元年 推理能力和多模态是研究重点
2025-03-12 13:29:09
美团发布并开源 LongCat-Flash-Omni 模型:支持实时音视频交互,达到 SOTA 水平
2025-11-03 11:17:00
693 文章
588623 浏览
24小时热文
更多
-
2026-04-22 21:32:58 -
2026-04-22 21:31:52 -
2026-04-22 21:30:46