首页 > 游戏攻略 >微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为

微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为

2025-02-26 15:00:53板才软件园

感谢本站网友 zhao_31 的线索投递!

本站 2 月 26 日消息,北京时间今日凌晨,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma 还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。

用户可以用 Magma 来自动下电商订单、查询天气;也可以自动操作实体机器人,或者在下真实象棋时获得帮助。

根据官方介绍,Magma 能够帮助 AI 驱动的助手或机器人理解周围环境并采取相应行动。例如,它可以帮助家用机器人学习如何整理以前从未见过的物品,或帮助虚拟助手为不熟悉的任务生成逐步的用户界面导航说明。

Magma 是能够适应数字和物理环境中新任务的 VLA(本站注:视觉语言动作)基础模型之一,能够有效地从海量的公开视觉和语言数据中学习知识,从而融合语言、空间和时间智能,应对数字和物理世界中的复杂任务和环境。

本站附开源链接:https://microsoft.github.io/Magma/

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之

9195
774

同类推荐更多

为什么“啊┅┅快┅┅用力啊小熊视频”如此受欢迎?揭秘视频背后的秘密与创作方式

为什么“啊┅┅快┅┅用力啊小熊视频”如此受欢迎?揭秘视频背后的秘密与创作方式

最火的游戏攻略

2025-02-10

在互联网时代,各种有趣、搞笑的视频内容层出不穷。近期,一段名为“啊┅┅快┅┅用力啊小熊视频”在网络上引发了广泛关注。许多人被视频中的情节和画面吸引,而这个视频背后也有它独特的魅力。视频的内容虽然简单,但却能够勾起观众的好奇心和笑点。接下来,我们一起来分析一下这段视频的受欢迎原因。 视频内容的吸引力 “啊┅┅快┅┅用力啊小熊视频”表面上看似普通,实际上它通过幽默的场景和夸张的表现手法引起了观众的关