Diffusion - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

开源模型叫板Nano Banana Pro！Stable Diffusion原班人马杀回来了

2025年11月，Stable Diffusion原班人马创立的黑森林实验室推出开源模型Flux.2，挑战谷歌Nano Banana Pro。Flux.2提供多个版本（[pro]、[flex]、[dev]及即将推出的[klein]），在生图质量、精细控制和性价比上表现出色，尤其适合生产力工具需求。实测显示，Flux.2能完成复杂指令如生成渐变花瓶、设计手机广告图等，效果接近Nano Banana Pro但成本更低。尽管在中文支持和部分细节上稍逊一筹，其图像编辑与多参考融合能力获得用户好评。Flux.2还支持4MP高分辨率编辑，修复老照片和增强真实感表现突出。这是继2024年8月发布Flux.1系列后团队的又一力作，在线体验已开放。

原文链接

量子黑客

11-26 17:54:14

Flux.2

Nano Banana Pro

Stable Diffusion

分享至

打开微信扫一扫

内容投诉

生成图片

字节跳动 Seed3D 1.0 发布：一张图就能生成高精度 3D 模型

10月23日，字节跳动Seed团队发布3D生成大模型Seed3D 1.0，可从单张图像生成高质量仿真级3D模型。该模型基于创新的Diffusion Transformer架构，支持精细几何、真实纹理和PBR材质生成，并能无缝导入仿真引擎如Isaac Sim，适用于具身智能训练。Seed3D 1.0在纹理与材质生成性能上超越开源及闭源模型，几何生成能力超过业界更大参数规模模型，综合性能领先。其分步生成策略可从单一物体扩展至完整场景，为世界模拟器提供丰富3D环境支持。项目主页及体验入口已开放。

原文链接

智能涌动

10-23 14:05:22

3D模型生成

Diffusion Transformer

Seed3D 1.0

分享至

打开微信扫一扫

内容投诉

生成图片

AMD 联手 Stability 推首款 BF16 精度 SD 3.0 Medium 模型，针对 XDNA 2 NPU 优化

7月22日，AMD宣布与Stability AI合作推出全球首款采用BF16精度格式的Stable Diffusion 3 Medium开源图片生成模型。该模型专为AMD锐龙AI 300/锐龙AI Max 300系列处理器中的XDNA 2架构NPU优化，需24GB系统内存和9GB运行内存，可在总内存不足32GB的笔记本上实现高质量本地图片生成。此外，搭载XDNA 2 NPU的平台支持超分辨率功能，可将生成的1024×1024图像增强至2048×2048。用户仅需三步即可完成本地部署：安装最新版AMD Software: Adrenalin Edition、Amuse 3.1 Beta，并在Amuse中切换至“XDNA 2 Stable Diffusion Offload”。

原文链接

超频思维站

07-22 17:36:49

AMD

Stable Diffusion

XDNA 2 NPU

分享至

打开微信扫一扫

内容投诉

生成图片

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

谷歌DeepMind推出文本生成新模型Gemini Diffusion，采用扩散技术，12秒可生成1万tokens，速度达2000tokens/秒，远超传统自回归模型。该模型通过逐步优化噪声生成输出，不仅能快速迭代，还能在生成过程中进行错误修正，适用于代码编辑及数学推理等任务。例如，在非因果推理测试中，Gemini Diffusion能同时生成完整答案及推导过程，而GPT-4o等自回归模型难以完成此类任务。目前，Gemini Diffusion仍处于实验阶段，用户可通过官方链接申请体验。这项技术可能预示未来混合模型的发展趋势，值得关注。

原文链接

Oasis

05-22 15:30:59

Gemini Diffusion

扩散模型

文本生成

分享至

打开微信扫一扫

内容投诉

生成图片

速度秒杀GPT们10倍，国外的DeepSeek时刻来了？

标题：速度秒杀GPT们10倍，国外的DeepSeek时代来了？前几天，一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。 Mercury在多项测试中表现亮眼，其生成速度比...

原文链接

AI思维矩阵

03-14 08:00:03

Diffusion

Mercury

Transformer

分享至

打开微信扫一扫

内容投诉

生成图片

开源文生图 AI 重磅选手上新：Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”

Stability AI 近日发布开源文生图模型Stable Diffusion 3.5，共提供Medium（10月29日发布）、Large和Large Turbo三种规模版本，以满足不同用户需求。其中，Large版本拥有80亿参数，专为专业场景设计；Turbo版本则是Large的简化版，优化了生成速度。Medium版本则具备25亿参数，采用MMDiT-X架构，预计10月29日上线，目标是在消费级硬件上实现“开箱即用”。尽管如此，Stability AI表示此次发布尚未完全达到预期，后续将继续优化。该系列模型均采用宽松社区许可，允许非商业用途免费使用，并对年收入低于100万美元的企业开放，超出门槛的企业需另行协商。

原文链接

量子思考者

10-23 09:28:56

AI 文生图

Stable Diffusion 3.5

开源模型

分享至

打开微信扫一扫

内容投诉

生成图片

Runway突然删库跑路，发生了啥？

Runway，一家知名AI视频创企，突然从Hugging Face和GitHub两大开源社区上清空了其开源模型，仅留下“404”和一段注释，表明已不再维护Hugging Face组织。这一行动引发了外界猜测，推测原因可能与Stability AI的利益纠纷或涉及侵权问题“销毁证据”有关。在官方未回应...

原文链接

蝶舞CyberSwirl

08-30 18:48:04

Runway

Stable Diffusion

删库跑路

分享至

打开微信扫一扫

内容投诉

生成图片

被冠上“最强图像AI”称号的FLUX，好像也就那样

标题：FLUX与Midjourney：图像AI的新竞争者正文：曾经与DALL·E、Midjourney齐名的图像生成AI Stable Diffusion，因内部动荡陷入困境。然而，其前团队成员在年初成立了Black Forest Lab（黑森林实验室），并迅速发布了三个图像生成模型——FLUX...

原文链接

小阳哥

08-15 15:42:54

Flux

Midjourney

Stable Diffusion

分享至

打开微信扫一扫

内容投诉

生成图片

全员离开老东家，Stable Diffusion一作带团创业，出手即击败MJ v6、SD3，还开源

AI图像与视频生成领域迎来新力量！原Stability AI研究科学家Robin Rombach宣布成立Black Forest Labs，携前同事共同创业。团队汇聚AI领域顶尖人才，拥有丰富成果，如VQGAN、Latent Diffusion、Stable Diffusion等。Black For...

原文链接

智能维度跳跃

08-02 16:04:42

Black Forest Labs

FLUX.1

Stable Diffusion

分享至

打开微信扫一扫

内容投诉

生成图片

Stable Diffusion原班人马新公司官宣！新模型一夜刷新AI绘画格局，已获2.3亿元融资

黑森林实验室，由Stable Diffusion的核心团队成员创建，今日宣布成立。该实验室推出了FLUX.1系列图像生成模型，包括pro、dev和schnell三个版本，分别在性能、效率和速度上各有侧重。其中，pro版本在视觉质量、提示响应度、尺寸灵活性、排版和输出多样性方面，超越了竞品如Midjourney v6.0、DALL·E 3 HD和Stable Diffusion 3-Ultra。黑森林实验室表示，其目标是提供先进的图像和视频生成深度学习模型，并在广泛受众中普及。此外，黑森林实验室宣布已完成3200万美元的融资，由a16z领投，多位行业大佬参与投资。随着新模型的发布，黑森林实验室还展示了其在视频生成领域的野心，计划推出“SOTA”级别的产品。

原文链接