生图模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

腾讯混元发布混元图像3.0图生图模型

1月26日，腾讯混元发布混元图像3.0图生图（HunyuanImage 3.0-Instruct）模型。新模型支持图片编辑与多图融合功能，并已在“元宝”平台同步上线。这一更新为用户提供了更强大的图像处理能力，进一步拓展了应用场景。

原文链接

智能维度跳跃

01-26 13:11:25

图生图模型

混元图像3.0

腾讯混元

分享至

打开微信扫一扫

内容投诉

生成图片

产品经理凌晨的突发奇想，谷歌揭秘“Nano Banana”AI 生图模型命名内幕

1月15日，谷歌揭秘其爆火AI生图模型‘Nano Banana’命名内幕。去年7月下旬，团队为Gemini 2.5 Flash Image模型准备上线时，因缺少公开名称，产品经理Naina Raisinghani凌晨突发奇想，结合自己的昵称‘Naina Banana’和‘Nano’提出这一搞笑名字。8月初提交至LMArena平台后，模型凭借强大能力震撼用户，名字也广受好评。最终，团队顺势将运行按钮改为黄色，并在生成图片按钮加入香蕉表情，强化品牌认知。

原文链接

WisdomTrail

01-18 15:24:50

AI生图模型

Nano Banana

谷歌

分享至

打开微信扫一扫

内容投诉

生成图片

6B文生图模型，上线即登顶抱抱脸

2025年12月，阿里通义发布全新图像模型Z-Image，上线HuggingFace首日下载量突破50万次，并迅速登顶两个榜单第一。Z-Image是一款6B参数的高效文生图模型，包含已开源的Z-Image-Turbo、未开源的Z-Image-Edit和Z-Image-Base三个版本，在写实风格生成、文本渲染及语义理解方面表现优异，质量接近甚至超越同期发布的FLUX.2。其采用单流DiT架构与Decoupled-DMD蒸馏技术，显著提升生成速度，仅需8步即可完成高清图像生成。测试显示，该模型在真实感、美学构图及复杂文字处理上表现出色，但小字渲染仍有改进空间。目前，Z-Image已在魔塔平台上线，开源地址同步公布，引发网友广泛热议与创意应用。

原文链接

阿达旻

12-01 17:19:39

HuggingFace

Z-Image

文生图模型

分享至

打开微信扫一扫

内容投诉

生成图片

发布首日下载量达 50 万，阿里通义详解最新 6B 小参数生图模型 Z-Image

11月28日，阿里通义发布最新生图模型Z-Image，上线首日下载量达50万，迅速登顶Hugging Face趋势榜双榜第一。该模型以6B小参数规模实现媲美大参数模型的照片级真实感，精细还原皮肤、发丝、光影等细节，并支持中英文混合文本渲染，效果领先。Z-Image具备广泛现实认知能力，可准确生成地标、人物及文化元素，还通过提示词增强器完成复杂创作任务。同时推出两款专用模型：Z-Image-Turbo仅需8步推理即可高效生成高质量图像；Z-Image-Edit支持精准复合编辑，保持身份、光照和风格一致性。模型已在GitHub、Hugging Face和ModelScope开源。

原文链接

梦境编程师

11-28 18:40:52

Z-Image

生图模型

阿里通义

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯混元图像 3.0 上线国内最大 AI 内容创作平台 LiblibAI

11月13日，腾讯混元图像3.0正式上线国内最大AI内容创作平台LiblibAI，并同步推出腾讯优图视频特效模型Youtu-Video FX。混元图像3.0参数规模达80B，是首个开源工业级原生多模态生图模型，官方称其为“效果最好、参数量最大”的开源模型，可对标业界头部闭源模型。该模型具备常识推理能力，支持解析千字复杂语义并生成长文本文字，适用于多种创意场景。作为今年5月发布的2.0版本升级版，3.0在画质和功能上进一步优化，此前已实现毫秒级响应与超写实画质。用户可通过LiblibAI平台体验相关功能。

原文链接

数字墨迹

11-13 12:00:33

LiblibAI

开源生图模型

腾讯混元图像 3.0

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌揭秘 AI 生图模型为何叫 Nano Banana：最初仅用于占位，爆火后“转正”

11月5日，谷歌揭晓其爆红AI生图模型Nano Banana的命名由来：最初仅为占位名，后因网友喜爱‘转正’。产品负责人David Sharon在播客中透露，模型正式名称为Gemini 2.5 Flash Image，临时命名由产品经理Nina凌晨灵光一闪写下。团队甚至加入香蕉图标呼应梗名。技术亮点在于高精度还原人物面孔，生成图像更接近真人。此外，模型支持流行趋势如泰国‘人偶’提示语、宝丽来拼贴风等玩法，并通过水印和SynthID标记确保安全可追溯。Sharon建议新用户从模板入手，体验化身新形象的乐趣，探索多样风格。

原文链接

未来编码者

11-06 21:16:39

AI生图模型

Nano Banana

谷歌

分享至

打开微信扫一扫

内容投诉

生成图片

刚刚，全球AI生图新王诞生！腾讯混元图像3.0登顶了

2025年10月5日，腾讯混元图像3.0登顶全球AI文生图榜单首位，超越谷歌Nano Banana、字节Seedream等强劲对手，在国际权威竞技场LMArena的26个大模型中稳居第一。该模型采用原生多模态架构，参数规模达80B，是目前最大的开源生图模型，支持文字、图片、视频与音频多模态处理。其语义理解能力大幅提升，可生成高质量图像，如中秋节海报、火焰猫咪等创意作品，并在多项技术指标上领先行业。此外，混元3.0开源且提供多种资源链接，引发全民体验热潮，热度持续飙升。

原文链接

智能维度跳跃

10-05 15:21:12

LMArena榜单

文生图模型

腾讯混元图像3.0

分享至

打开微信扫一扫

内容投诉

生成图片

给大模型生图“去油”，腾讯混元新研究 SRPO 公布

正文：9月10日，腾讯混元团队发布新研究SRPO（语义相对偏好优化），解决开源文生图模型Flux生成人像皮肤“过油”问题，显著提升真实感。该技术通过在线调整奖励偏好、优化生成轨迹等方法，定向增强特定维度表现，并有效避免奖励破解风险。SRPO创新性采用正负向词引导及Direct-Align策略，显著降低过拟合与偏色等问题，训练仅需10分钟，效果超越主流方法DanceGRPO，效率提升75倍。项目上线后迅速登上Hugging Face热度榜榜首，社区版本下载量达25K，GitHub Star超700。

原文链接

电子诗篇

09-17 21:36:40

SRPO

文生图模型

腾讯混元

分享至

打开微信扫一扫

内容投诉

生成图片

全网都在玩的生图模型，我用它把iPhone17提前发布了

9月9日，火山引擎正式上线豆包・图像创作模型Seedream 4.0。该模型支持最高4K高清图片输出，为首个达到此标准的多模态生图模型，企业用户已可抢先体验，个人用户则于今晚20:00开放体验。Seedream 4.0具备超强主体一致性、多图灵活创作及连续生图等核心能力。APPSO通过内测发现，该模型不仅能高质量生成虚拟产品页面如iPhone 17 Air，还能精准处理真实质感和复杂场景细节。此外，Seedream 4.0采用DiT-MoE架构，计算效率较上一代提升10倍以上，最快1.8秒生成一张2K高清图，展现出强大的生产力应用潜力，被视为规模化创意平台。

原文链接

数码游侠

09-09 16:19:55

Nano Banana

Seedream 4.0

生图模型

分享至

打开微信扫一扫

内容投诉

生成图片

隐姓埋名的小香蕉悄悄吊着打所有生图模型！

2025年8月29日，谷歌AI Studio正式上线了神秘图片生成模型nano-banana。此前，该模型在大模型竞技场LMArena中表现出色，以超强的一致性和提示词理解能力击败众多生图模型，荣登榜单第一。谷歌产品经理通过发香蕉表情暗中认领了这一模型。nano-banana擅长保持图像一致性，支持多轮修图、风格变换及3D手办生成，细节处理尤为出色。但其风格变换较为中规中矩，且对提示词要求较高，需详细描述才能达到理想效果。此外，模型因安全性调教较严格，部分关键词可能受限。目前，nano-banana已整合进Gemini 2.5 Flash版本，免费账户也可使用，同时在LMArena和第三方平台如LibLib、Fal-ai上均可体验。

原文链接