1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【摘要】近日,智源研究院发布原生多模态世界模型Emu3,该模型可实现视频、图像、文本三种模态的统一理解与生成。当前行业中的多模态大模型多为针对特定任务的专用模型,Emu3则首次证明了下一token预测在多模态任务中的高效表现,为构建多模态AGI提供了技术前景。智源研究院院长王仲远指出,Emu3能统一表示空间,实现跨模态的统一训练和生成,有望推动机器人、自动驾驶、多模态对话等领域的发展。此外,Emu3采用统一的Tokenizer系统,将不同模态信息映射至同一空间,简化了训练过程,降低了基础设施需求。此次发布标志着多模态大模型向AGI迈进的重要一步,相关技术或将在未来加快产业化进程。(10月22日,《科创板日报》报道)

原文链接
本文链接:https://kx.umi6.com/article/7656.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
2025-12-11 19:06:41
OpenAI的弑神赌局,看懂的人还不多
2025-10-29 10:48:08
上线4天下载破百万,蚂蚁CTO:灵光要做AGI时代的“支付宝”
2025-11-24 16:03:25
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
蓝色巨人IBM看空AI:8万亿美元回不了本 AGI可能性0-1%
2025-12-03 20:41:46
美团新独立APP,点不了菜只能点AI
2025-11-03 12:17:52
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率
2025-08-15 15:17:00
何小鹏:当前没有AI泡沫 未来AI市场有巨大机遇
2025-12-17 13:43:34
通用人工智能就在身边,为何我们感知却不明显?
2025-09-08 09:58:00
别听模型厂商的,“提示”不是功能,是bug
2025-08-10 10:44:56
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
24小时热文
更多
扫一扫体验小程序