微软于2月26日开源了多模态AI Agent基础模型——Magma。Magma具备跨数字和物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,并内置心理预测功能,增强对视频中人物或物体意图及未来行为的理解。用户可用Magma自动下电商订单、查询天气,或控制实体机器人。Magma还能帮助AI驱动的助手理解环境并采取行动,例如帮助家用机器人学习整理未知物品,或为虚拟助手生成不熟悉任务的导航说明。Magma是VLA基础模型之一,能从大量公开数据中学习,融合语言、空间和时间智能以应对复杂任务。详情见:
原文链接
本文链接:https://kx.umi6.com/article/14342.html
转载请注明文章出处
相关推荐
.png)
换一换
“AI掉队者联盟”谋求改命
2025-06-11 19:17:32
Manus扇动蝴蝶翅膀 能否刮起AI Agent暴风?
2025-03-28 19:00:28
智谱发布集深度研究和操作执行于一体的Agent,背后推理模型媲美DeepSeek-R1
2025-03-31 14:34:38
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化
2025-05-10 14:06:22
“美国国运股”Palantir,怎么靠AI Agent大涨3000亿美元?
2025-07-03 15:28:38
搜索已死
2025-06-24 09:15:16
阿里通义千问 2.5-Omni-3B AI 全模态登场:7B 版 90% 性能,显存占用减少 53%
2025-05-01 11:20:52
阿里云通义千问发布新一代端到端多模态旗舰模型 Qwen2.5-Omni 并开源,看听说写样样精通
2025-03-27 07:33:35
ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手
2025-05-21 15:05:55
摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
2025-03-31 17:40:22
Salesforce 力压 AI Agent 赛道,称公司 30%-50% 日常工作已被人工智能接管
2025-06-27 15:09:40
豆包大模型1.6正式发布
2025-06-11 11:12:11
2025上半年,AI Agent领域有什么变化和机会?
2025-07-11 08:33:06
411 文章
59046 浏览
24小时热文
更多

-
2025-07-22 17:39:06
-
2025-07-22 17:38:56
-
2025-07-22 17:37:59