Meta近日宣布开源其最新的多模态大模型Llama 3.2,该系列模型共分为四个版本,涵盖从1B、3B的轻量级模型到11B、90B的视觉增强型模型。Llama 3.2 1B、3B模型旨在适应边缘设备和移动应用,支持128k标记的上下文长度,且已针对高通和联发科硬件进行了优化,优化后的Arm处理器兼容性使其广泛应用于各类移动和物联网设备。此系列的11B和90B版本则首次加入了视觉处理能力,不仅能够理解和推理图像,还能完成文档分析、图像字幕、视觉问答等任务。 Llama 3.2 90B版本具备强大的常识、长文本生成、多语言翻译、编码、数学和高级推理能力,同时新增了图像推理功能,能够进行图像标题生成、图像文本检索、视觉基础、视觉问题解答和视觉推理,以及文档视觉问题解答等任务。而11B版本则适用于内容创建、对话式AI、语言理解等领域,尤其在文本摘要、情感分析、代码生成和指令执行方面表现出色,同样增加了图像推理能力,其功能与90B版本相似,但侧重于不同应用场景的需求。 测试结果显示,Llama 3.2模型在图像识别和视觉理解基准测试中与当前领先的人工智能模型具有竞争力,显示了Meta在多模态AI领域的技术实力。此次开源行动旨在推动多模态AI技术的普及和创新,促进AI社区的合作与进步。
原文链接
本文链接:https://kx.umi6.com/article/7095.html
转载请注明文章出处
相关推荐
换一换
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
中方如何评论Meta将收购Manus?外交部:建议记者向主管部门询问
2025-12-30 16:29:17
达瑞电子:与Meta客户的各项目合作正有序推进 有望成为公司明年业务增量新机会点
2025-09-22 08:57:31
Meta 被指 AI 生成广告泛滥,多名英国消费者称花高价买到“假英国品牌”
2025-11-29 16:23:36
收购「Manus」也治不好大厂的焦虑症
2026-01-06 19:24:45
你的绩效将跟“怎么用 AI”挂钩,Meta 明年引入全新员工评估机制
2025-11-15 16:59:23
Meta的新款AI眼镜获看好 华尔街投行纷纷唱多
2025-09-19 17:22:51
消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
2025-11-25 11:48:26
行业首个:商汤发布并开源 NEO 原生多模态模型架构,实现视觉、语言深层统一
2025-12-02 23:39:14
特斯拉 Optimus AI 团队负责人 Kumar 跳槽 Meta,自称“不是为了钱”
2025-09-19 20:20:05
Manus收购案细节曝光:20亿刀闪电成交,CEO不向亚历山大王汇报
2025-12-31 10:09:33
Meta高管回应AI泡沫质疑:如今繁荣看似激进 但并未失控
2025-11-16 19:48:26
Manus补上一块短板,但Meta AI的短板实在太多了
2026-01-02 18:29:42
595 文章
379214 浏览
24小时热文
更多
-
2026-01-24 15:06:49 -
2026-01-24 15:05:40 -
2026-01-24 15:04:33