【苹果推出300亿参数多模态AI大模型MM1.5】苹果公司在10月13日发布了一款名为MM1.5的多模态AI大模型,该模型拥有300亿参数,是基于前代MM1架构发展而来。MM1.5在数据驱动的训练原则下,着重研究不同训练周期中混合数据对模型性能的影响,并在Hugging Face平台上发布了相关模型文档。此模型具备图像识别和自然语言推理能力,提供从10亿到300亿参数规模的选择。苹果团队通过改进数据混合策略,显著提升了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的性能。特别地,MM1.5模型在持续预训练阶段引入高质量的OCR数据和合成图像描述,增强了对包含大量文本的图像的理解。此外,通过优化视觉指令微调数据的混合方式,即使是小规模模型也能展现出出色性能,实现了更高的效率。苹果还推出了专门用于视频理解和移动设备用户界面(UI)处理的MM1.5-Video和MM1.5-UI模型,后者有望成为iOS系统背后的AI核心,增强对UI的理解与交互能力。尽管MM1.5在多项基准测试中表现出色,苹果团队仍致力于通过融合更多元的数据和复杂架构,进一步提升模型的移动设备UI理解能力,以实现更强的AI性能。
原文链接
本文链接:https://kx.umi6.com/article/7315.html
转载请注明文章出处
相关推荐
换一换
苹果核心AI人才持续外流 机器人研究负责人跳槽至Meta
2025-09-03 09:46:04
库克虎口夺食:马斯克盯上的北大校友AI公司被苹果抢走
2025-10-11 12:26:14
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
苹果Meta狂抓AI,抢人并购
2025-06-24 07:33:15
郭明錤:苹果AI表现或令投资人失望 恐影响AR眼镜
2025-06-10 09:45:28
AI搜索引擎,苹果决定自研!代号WKA
2025-09-04 09:57:52
苹果 FastVLM 模型开放试用:Mac 用户秒享“闪电级”视频字幕,生成速度较同类 AI 快 85 倍
2025-09-02 08:27:47
苹果搁置头显升级计划,优先开发可媲美Meta的智能眼镜
2025-10-02 06:02:35
落差最大的WWDC:要AI没有,要UI苹果砸你一脸玻璃
2025-06-10 09:44:25
消息称博通有望拿下苹果、xAI 的 AI ASIC 订单
2025-09-09 11:12:15
巨鲸来袭,苹果进军机器人市场
2025-12-09 12:34:55
OpenAI想杀入苹果“腹地”
2025-09-20 18:33:36
谷歌为什么又行了?
2025-09-06 19:37:51
697 文章
434915 浏览
24小时热文
更多
-
2026-01-23 17:04:25 -
2026-01-23 16:04:10 -
2026-01-23 15:02:58