Manzano - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

苹果探索自研多模态 AI 模型 Manzano：兼具理解与生成能力，不弱于 OpenAI GPT-4o 和谷歌 Nano Banana

苹果正研发名为Manzano的多模态AI模型，具备图像理解与生成能力，旨在解决开源模型在综合表现上的不足。据9月27日消息，该模型性能不逊于OpenAI GPT-4o和谷歌Nano Banana。Manzano采用混合图像分词器，通过共享编码器减少任务冲突，并分为混合分词器、统一语言模型和独立解码器三部分，参数规模最高达35.2亿。训练数据包括23亿图像-文本对，总计处理1.6万亿标记。内部测试显示，其在文字密集型任务中表现优异，扩展性良好。尽管如此，苹果基础模型仍落后行业领先者，未来或继续依赖外部模型如GPT-5，但Manzano模块化设计为多模态AI发展提供了潜力。

原文链接