2025年10月,北京智源人工智能研究院发布开源多模态世界模型Emu3.5,性能超越Nano Banana(Gemini-2.5-Flash-Image),在多项权威基准测试中取得领先。Emu3.5具备强大的物理模拟与逻辑连贯性能力,支持图、文、视频任务,可生成高精度动态场景并保持空间一致性,适用于第一视角虚拟世界探索、复杂图像编辑及分步教学等。技术上,基于Decoder-only Transformer架构,参数量34B,通过海量视频数据预训练和多阶段对齐优化,并引入离散扩散适配(DiDA)技术提升推理速度近20倍。Emu3.5已全面开源,为开发者和研究者提供基础模型支持,推动智能体构建与行业应用创新。项目主页与内测申请已上线。
原文链接
            
                本文链接:https://kx.umi6.com/article/27577.html
              
              转载请注明文章出处
            相关推荐
            .png) 
              换一换
            Grok 4宣布全球免费使用
              2025-08-11 11:04:47
            李飞飞发布全新世界模型,单GPU就能跑!
              2025-10-17 13:16:03
            仅需一块GPU!“AI教母”公布最新世界模型 算力需求“天花板”会更高吗?
              2025-10-17 17:26:37
            多模态和Agent成为大厂AI的新赛点
              2025-04-30 20:07:29
            小扎砸9位数挖AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反击了
              2025-06-12 15:36:40
            「阶跃星辰」的一次豪赌
              2025-05-21 08:55:53
            我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
              2025-08-05 19:18:01
            “AI教母”李飞飞揭秘“世界模型”:要让AI像人类一样理解三维空间
              2025-06-06 11:29:37
            DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
              2025-08-12 14:22:32
            恐替代你的岗位:谷歌迈步通用人工智能,AI 世界模型 Genie 3 登场
              2025-08-06 08:25:25
            全球首个深度推理+多模态大模型“紫东太初”4.0发布
              2025-09-19 13:13:31
            摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
              2025-03-31 17:40:22
            世界模型版《模拟人生》
              2025-06-24 11:15:47
            540 文章
      
      295850 浏览
    
      24小时热文
    
    更多
         
    - 
        
         2025-10-31 15:41:06 2025-10-31 15:41:06
- 
        
         2025-10-31 15:40:41 2025-10-31 15:40:41
- 
        
         2025-10-31 15:39:57 2025-10-31 15:39:57
.png) 
      
       
       
       
               
                 
                   
              .png) 
               
     
     
  