【苹果推出300亿参数多模态AI大模型MM1.5】苹果公司在10月13日发布了一款名为MM1.5的多模态AI大模型,该模型拥有300亿参数,是基于前代MM1架构发展而来。MM1.5在数据驱动的训练原则下,着重研究不同训练周期中混合数据对模型性能的影响,并在Hugging Face平台上发布了相关模型文档。此模型具备图像识别和自然语言推理能力,提供从10亿到300亿参数规模的选择。苹果团队通过改进数据混合策略,显著提升了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的性能。特别地,MM1.5模型在持续预训练阶段引入高质量的OCR数据和合成图像描述,增强了对包含大量文本的图像的理解。此外,通过优化视觉指令微调数据的混合方式,即使是小规模模型也能展现出出色性能,实现了更高的效率。苹果还推出了专门用于视频理解和移动设备用户界面(UI)处理的MM1.5-Video和MM1.5-UI模型,后者有望成为iOS系统背后的AI核心,增强对UI的理解与交互能力。尽管MM1.5在多项基准测试中表现出色,苹果团队仍致力于通过融合更多元的数据和复杂架构,进一步提升模型的移动设备UI理解能力,以实现更强的AI性能。
原文链接
本文链接:https://kx.umi6.com/article/7315.html
转载请注明文章出处
相关推荐
换一换
曝苹果拟收购Perplexity AI,人才一并拿走
2025-06-23 17:26:38
自研模型进度缓慢,古尔曼称苹果 Siri 正考虑转向 Anthropic 或 OpenAI 技术合作
2025-07-01 07:50:51
苹果向英伟达生态妥协了!MLX框架主动适配CUDA
2025-07-17 14:22:02
落差最大的WWDC:要AI没有,要UI苹果砸你一脸玻璃
2025-06-10 09:44:25
苹果人工智能团队再现人才流失:一位机器人专家已跳槽Meta
2025-09-03 16:48:57
马斯克:xAI将对苹果采取法律行动
2025-08-12 10:16:54
马斯克威胁:将立即对苹果采取法律行动
2025-08-12 18:23:47
AI生成快捷指令,苹果AI最有用的一集来了?
2025-06-06 15:33:38
苹果计划为Siri开发基于人工智能的网页搜索工具 以与OpenAI竞争
2025-09-04 04:55:53
苹果新 AI 模型长视频理解夺冠,小至 1B 版本也领先对手
2025-08-23 16:02:10
库克虎口夺食:马斯克盯上的北大校友AI公司被苹果抢走
2025-10-11 12:26:14
苹果新掌门的头号任务
2025-11-18 08:03:56
消息称苹果考虑收购欧洲最大 AI 初创公司 Mistral,有望推动其史上最大并购案
2025-07-14 20:26:20
644 文章
356356 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42