2025年10月,北京智源人工智能研究院发布开源多模态世界模型Emu3.5,性能超越Nano Banana(Gemini-2.5-Flash-Image),在多项权威基准测试中取得领先。Emu3.5具备强大的物理模拟与逻辑连贯性能力,支持图、文、视频任务,可生成高精度动态场景并保持空间一致性,适用于第一视角虚拟世界探索、复杂图像编辑及分步教学等。技术上,基于Decoder-only Transformer架构,参数量34B,通过海量视频数据预训练和多阶段对齐优化,并引入离散扩散适配(DiDA)技术提升推理速度近20倍。Emu3.5已全面开源,为开发者和研究者提供基础模型支持,推动智能体构建与行业应用创新。项目主页与内测申请已上线。
原文链接
本文链接:https://kx.umi6.com/article/27577.html
转载请注明文章出处
相关推荐
换一换
ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
2025-11-08 13:40:25
宇树开源 UnifoLM-WMA-0 世界模型架构:可理解机器人与环境交互物理规律
2025-09-15 21:02:02
“AI教母”李飞飞发布首款商用世界模型
2025-11-13 09:53:54
对话微分智飞高飞:看具身智能如何引发飞行认知革命 | GAIR 2025
2025-12-31 16:33:34
GAIR 2025 世界模型论坛:走向真实智能的起点
2025-11-30 16:20:12
“AI掉队者联盟”谋求改命
2025-06-11 19:17:32
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
2025-10-13 09:54:06
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
2025-08-13 15:36:41
小扎砸9位数挖AI 大神、杨立昆发布世界模型,被群嘲的开源旧王要反击了
2025-06-12 15:36:40
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
Grok 4宣布全球免费使用
2025-08-11 11:04:47
Meta推出世界模型V-JEPA 2 杨立昆参与开发
2025-06-12 14:36:04
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
626 文章
437995 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34