1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

全球首个原生多模态世界模型Emu3发布,由北京智源人工智能研究院(智源研究院)开发,采用自回归技术路线。Emu3参数量为80亿,能够统一处理图像、文本和视频,无需扩散模型或组合式方法,直接预测下一个token。在多项测试中,Emu3的表现超越了现有主流开源模型,如Stable Diffusion SDXL、LLaVA和OpenSora等。

智源研究院院长王仲远表示,Emu3展示了自回归技术在多模态任务中的高性能,为构建多模态AGI提供了技术前景。未来,Emu3有望促进机器人大脑、自动驾驶、多模态对话和推理等应用场景的发展。

Emu3的发布标志着大模型能通过更多维度的数据来理解、学习真实世界。在图像生成、文生视频和语言能力方面,Emu3均表现出色,但语言能力仍有提升空间。王仲远认为,当前多模态领域仍处于早期阶段,未来需进一步扩大训练规模,推动Emu3的应用。

此外,算力、数据和生态是当前多模态世界模型面临的挑战。尽管如此,智源研究院将继续研发原生多模态世界模型Emu系列,解决更大规模的数据、算力及训练问题。未来三到五年,智源将聚焦多模态大模型的研发与应用,特别是在AI for Science领域。

原文链接
本文链接:https://kx.umi6.com/article/7693.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智源研究院发布原生多模态世界模型Emu3
2024-10-21 19:37:49
多模态实力领跑开源大模型!阶跃星辰与吉利宣布联合开源两款多模态大模型
2025-02-18 10:16:14
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
智源研究院宣布开源超长视频理解模型Video-XL-2
2025-06-03 12:58:08
当下,阿里国际某个指标每两个月就翻一倍
2024-07-20 14:13:21
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
2025-05-29 12:28:01
突破不可解释性!视频异常新检测框架精度90.67%拿下SOTA|华科&百度&密歇根大学
2024-07-07 14:30:39
GPT-4o能拼好乐高吗?首个多步空间推理评测基准:闭源模型领跑
2025-04-23 11:52:51
张宏江消除“Scaling Law放缓”恐惧,直言未来将迎来“自主智能”的世界
2024-12-07 17:49:03
密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25
2025-07-14 14:19:19
字节迭代多模态大模型 媲美谷歌新品 智能体能力更强、推理成本更低
2025-05-13 15:57:01
王兴兴透露:宇树机器人已能完成绝大部分工作动作
2025-11-16 15:42:36
阶跃星辰首次开源Step系列多模态大模型
2025-02-18 10:17:17
24小时热文
更多
扫一扫体验小程序