
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月,谷歌发布全新图像模型nano banana,引爆AI社区。该模型可融合多张图片生成全新画面,理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini技术,nano banana实现“有记忆”的多轮创作,具备极高一致性和创造力。用户可上传最多13张图片进行拼接,或标注现实场景中的地标建筑。模型还能从等高线生成地貌、渲染工程视图、定制试衣效果,并修复老照片。其背后技术包括多模态上下文处理与交错生成,灵感源于网友反馈和团队对文字渲染的执着。谷歌DeepMind团队透露,未来目标是让模型超越指令,提供更优创意解。目前,nano banana已在LMArena上线并获高度评价。
原文链接
2025年8月,谷歌推出的Nano Banana(Gemini 2.5 Flash Image)图像编辑模型因生成逼真手办效果火爆出圈。用户无需抽卡即可生成1/7比例的手办模型,支持动漫角色、宠物及真人照片等多种参考图,细节表现惊人。该模型采用原生多模态与交错式生成技术,可处理复杂编辑任务,并通过文本渲染指标优化性能。团队基于用户反馈改进了像素级编辑、角色一致性等短板,显著提升质感与实用性。此外,谷歌宣布将于近期举办Nano Banana Hackathon活动,提供免费API额度和奖品。用户可通过AI Studio或Gemini API体验这一创新工具,掀起全网试玩热潮。
原文链接
加载更多

暂无内容