
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
苹果正研发名为Manzano的多模态AI模型,具备图像理解与生成能力,旨在解决开源模型在综合表现上的不足。据9月27日消息,该模型性能不逊于OpenAI GPT-4o和谷歌Nano Banana。Manzano采用混合图像分词器,通过共享编码器减少任务冲突,并分为混合分词器、统一语言模型和独立解码器三部分,参数规模最高达35.2亿。训练数据包括23亿图像-文本对,总计处理1.6万亿标记。内部测试显示,其在文字密集型任务中表现优异,扩展性良好。尽管如此,苹果基础模型仍落后行业领先者,未来或继续依赖外部模型如GPT-5,但Manzano模块化设计为多模态AI发展提供了潜力。
原文链接
加载更多

暂无内容