【摘要】近日,智源研究院发布原生多模态世界模型Emu3,该模型可实现视频、图像、文本三种模态的统一理解与生成。当前行业中的多模态大模型多为针对特定任务的专用模型,Emu3则首次证明了下一token预测在多模态任务中的高效表现,为构建多模态AGI提供了技术前景。智源研究院院长王仲远指出,Emu3能统一表示空间,实现跨模态的统一训练和生成,有望推动机器人、自动驾驶、多模态对话等领域的发展。此外,Emu3采用统一的Tokenizer系统,将不同模态信息映射至同一空间,简化了训练过程,降低了基础设施需求。此次发布标志着多模态大模型向AGI迈进的重要一步,相关技术或将在未来加快产业化进程。(10月22日,《科创板日报》报道)
原文链接
本文链接:https://kx.umi6.com/article/7656.html
转载请注明文章出处
相关推荐
.png)
换一换
面壁CEO李大海:物理世界要实现AGI,一定是通过端侧智能
2025-05-09 13:48:51
GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?
2025-08-01 08:52:52
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
OpenAI 重申今夏推出最强模型 GPT-5,具备完整多模态 AI 能力
2025-07-07 21:35:27
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
2025-08-01 09:07:26
Grok 4宣布全球免费使用
2025-08-11 11:04:47
我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
2025-08-05 19:18:01
别听模型厂商的,“提示”不是功能,是bug
2025-08-10 10:44:56
「阶跃星辰」的一次豪赌
2025-05-21 08:55:53
为何强化学习火遍硅谷?AGI的关键一步
2025-08-07 15:55:40
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
2025-05-08 20:39:27
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
527 文章
174015 浏览
24小时热文
更多

-
2025-09-06 14:35:37
-
2025-09-06 14:35:21
-
2025-09-06 12:37:21