综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月15日,谷歌揭秘其爆火AI生图模型‘Nano Banana’命名内幕。去年7月下旬,团队为Gemini 2.5 Flash Image模型准备上线时,因缺少公开名称,产品经理Naina Raisinghani凌晨突发奇想,结合自己的昵称‘Naina Banana’和‘Nano’提出这一搞笑名字。8月初提交至LMArena平台后,模型凭借强大能力震撼用户,名字也广受好评。最终,团队顺势将运行按钮改为黄色,并在生成图片按钮加入香蕉表情,强化品牌认知。
原文链接
2025年12月,阿里通义发布全新图像模型Z-Image,上线HuggingFace首日下载量突破50万次,并迅速登顶两个榜单第一。Z-Image是一款6B参数的高效文生图模型,包含已开源的Z-Image-Turbo、未开源的Z-Image-Edit和Z-Image-Base三个版本,在写实风格生成、文本渲染及语义理解方面表现优异,质量接近甚至超越同期发布的FLUX.2。其采用单流DiT架构与Decoupled-DMD蒸馏技术,显著提升生成速度,仅需8步即可完成高清图像生成。测试显示,该模型在真实感、美学构图及复杂文字处理上表现出色,但小字渲染仍有改进空间。目前,Z-Image已在魔塔平台上线,开源地址同步公布,引发网友广泛热议与创意应用。
原文链接
11月28日,阿里通义发布最新生图模型Z-Image,上线首日下载量达50万,迅速登顶Hugging Face趋势榜双榜第一。该模型以6B小参数规模实现媲美大参数模型的照片级真实感,精细还原皮肤、发丝、光影等细节,并支持中英文混合文本渲染,效果领先。Z-Image具备广泛现实认知能力,可准确生成地标、人物及文化元素,还通过提示词增强器完成复杂创作任务。同时推出两款专用模型:Z-Image-Turbo仅需8步推理即可高效生成高质量图像;Z-Image-Edit支持精准复合编辑,保持身份、光照和风格一致性。模型已在GitHub、Hugging Face和ModelScope开源。
原文链接
11月13日,腾讯混元图像3.0正式上线国内最大AI内容创作平台LiblibAI,并同步推出腾讯优图视频特效模型Youtu-Video FX。混元图像3.0参数规模达80B,是首个开源工业级原生多模态生图模型,官方称其为“效果最好、参数量最大”的开源模型,可对标业界头部闭源模型。该模型具备常识推理能力,支持解析千字复杂语义并生成长文本文字,适用于多种创意场景。作为今年5月发布的2.0版本升级版,3.0在画质和功能上进一步优化,此前已实现毫秒级响应与超写实画质。用户可通过LiblibAI平台体验相关功能。
原文链接
11月5日,谷歌揭晓其爆红AI生图模型Nano Banana的命名由来:最初仅为占位名,后因网友喜爱‘转正’。产品负责人David Sharon在播客中透露,模型正式名称为Gemini 2.5 Flash Image,临时命名由产品经理Nina凌晨灵光一闪写下。团队甚至加入香蕉图标呼应梗名。技术亮点在于高精度还原人物面孔,生成图像更接近真人。此外,模型支持流行趋势如泰国‘人偶’提示语、宝丽来拼贴风等玩法,并通过水印和SynthID标记确保安全可追溯。Sharon建议新用户从模板入手,体验化身新形象的乐趣,探索多样风格。
原文链接
2025年10月5日,腾讯混元图像3.0登顶全球AI文生图榜单首位,超越谷歌Nano Banana、字节Seedream等强劲对手,在国际权威竞技场LMArena的26个大模型中稳居第一。该模型采用原生多模态架构,参数规模达80B,是目前最大的开源生图模型,支持文字、图片、视频与音频多模态处理。其语义理解能力大幅提升,可生成高质量图像,如中秋节海报、火焰猫咪等创意作品,并在多项技术指标上领先行业。此外,混元3.0开源且提供多种资源链接,引发全民体验热潮,热度持续飙升。
原文链接
正文:9月10日,腾讯混元团队发布新研究SRPO(语义相对偏好优化),解决开源文生图模型Flux生成人像皮肤“过油”问题,显著提升真实感。该技术通过在线调整奖励偏好、优化生成轨迹等方法,定向增强特定维度表现,并有效避免奖励破解风险。SRPO创新性采用正负向词引导及Direct-Align策略,显著降低过拟合与偏色等问题,训练仅需10分钟,效果超越主流方法DanceGRPO,效率提升75倍。项目上线后迅速登上Hugging Face热度榜榜首,社区版本下载量达25K,GitHub Star超700。
原文链接
9月9日,火山引擎正式上线豆包・图像创作模型Seedream 4.0。该模型支持最高4K高清图片输出,为首个达到此标准的多模态生图模型,企业用户已可抢先体验,个人用户则于今晚20:00开放体验。Seedream 4.0具备超强主体一致性、多图灵活创作及连续生图等核心能力。APPSO通过内测发现,该模型不仅能高质量生成虚拟产品页面如iPhone 17 Air,还能精准处理真实质感和复杂场景细节。此外,Seedream 4.0采用DiT-MoE架构,计算效率较上一代提升10倍以上,最快1.8秒生成一张2K高清图,展现出强大的生产力应用潜力,被视为规模化创意平台。
原文链接
2025年8月29日,谷歌AI Studio正式上线了神秘图片生成模型nano-banana。此前,该模型在大模型竞技场LMArena中表现出色,以超强的一致性和提示词理解能力击败众多生图模型,荣登榜单第一。谷歌产品经理通过发香蕉表情暗中认领了这一模型。nano-banana擅长保持图像一致性,支持多轮修图、风格变换及3D手办生成,细节处理尤为出色。但其风格变换较为中规中矩,且对提示词要求较高,需详细描述才能达到理想效果。此外,模型因安全性调教较严格,部分关键词可能受限。目前,nano-banana已整合进Gemini 2.5 Flash版本,免费账户也可使用,同时在LMArena和第三方平台如LibLib、Fal-ai上均可体验。
原文链接
2023年6月26日,谷歌推出最新AI文生图模型Imagen 4及高端版本Imagen 4 Ultra。Imagen 4定位为通用模型,每张图片收费0.04美元(约0.29元人民币),而Imagen 4 Ultra价格提高50%,每张0.06美元(约0.43元人民币)。谷歌称其生成效果优于Dall-E和Midjourney,但实际展示的图像质量虽符合文本提示词,但整体仍显机械化。目前,这两个版本已上线Gemini API付费预览版,并在Google AI Studio提供有限免费测试。
原文链接
加载更多
暂无内容