
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
微软于2月26日开源了多模态AI Agent基础模型——Magma。Magma具备跨数字和物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,并内置心理预测功能,增强对视频中人物或物体意图及未来行为的理解。用户可用Magma自动下电商订单、查询天气,或控制实体机器人。Magma还能帮助AI驱动的助手理解环境并采取行动,例如帮助家用机器人学习整理未知物品,或为虚拟助手生成不熟悉任务的导航说明。Magma是VLA基础模型之一,能从大量公开数据中学习,融合语言、空间和时间智能以应对复杂任务。详情见:
原文链接
《科创板日报》26日,微软在官网开源了多模态AI Agent基础模型Magma。与传统Agent相比,Magma具有跨数字、物理世界的多模态能力,可自动处理图像、视频、文本等多种类型数据。Magma还内置了心理预测功能,增强对视频中人物或物体意图及未来行为的理解。
原文链接
加载更多

暂无内容