微软于2月26日开源了多模态AI Agent基础模型——Magma。Magma具备跨数字和物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,并内置心理预测功能,增强对视频中人物或物体意图及未来行为的理解。用户可用Magma自动下电商订单、查询天气,或控制实体机器人。Magma还能帮助AI驱动的助手理解环境并采取行动,例如帮助家用机器人学习整理未知物品,或为虚拟助手生成不熟悉任务的导航说明。Magma是VLA基础模型之一,能从大量公开数据中学习,融合语言、空间和时间智能以应对复杂任务。详情见:
原文链接
本文链接:https://kx.umi6.com/article/14342.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI 重申今夏推出最强模型 GPT-5,具备完整多模态 AI 能力
2025-07-07 21:35:27
多模态和Agent成为大厂AI的新赛点
2025-04-30 20:07:29
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
2025-05-08 20:39:27
如何用AI构建个人知识库?
2025-07-22 16:35:29
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
AI时代的SaaS,出路在哪里?
2025-08-01 09:09:36
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷
2025-07-28 20:19:06
2025,AI Agent赛道还有哪些机会?
2025-05-26 16:26:48
张一鸣门徒的AI战争:不做通用大模型,专攻“大厂缝隙”
2025-08-01 15:06:59
华为汪涛:到2030年全球将有近百亿个人AI Agent
2025-06-19 11:48:42
Salesforce:AI到底是“救星”还是“丧钟”?
2025-09-04 15:03:41
对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事
2025-07-27 10:53:25
468 文章
172143 浏览
24小时热文
更多

-
2025-09-09 11:15:41
-
2025-09-09 11:14:37
-
2025-09-09 11:13:28