综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年11月,Stable Diffusion原班人马创立的黑森林实验室推出开源模型Flux.2,挑战谷歌Nano Banana Pro。Flux.2提供多个版本([pro]、[flex]、[dev]及即将推出的[klein]),在生图质量、精细控制和性价比上表现出色,尤其适合生产力工具需求。实测显示,Flux.2能完成复杂指令如生成渐变花瓶、设计手机广告图等,效果接近Nano Banana Pro但成本更低。尽管在中文支持和部分细节上稍逊一筹,其图像编辑与多参考融合能力获得用户好评。Flux.2还支持4MP高分辨率编辑,修复老照片和增强真实感表现突出。这是继2024年8月发布Flux.1系列后团队的又一力作,在线体验已开放。
原文链接
10月23日,字节跳动Seed团队发布3D生成大模型Seed3D 1.0,可从单张图像生成高质量仿真级3D模型。该模型基于创新的Diffusion Transformer架构,支持精细几何、真实纹理和PBR材质生成,并能无缝导入仿真引擎如Isaac Sim,适用于具身智能训练。Seed3D 1.0在纹理与材质生成性能上超越开源及闭源模型,几何生成能力超过业界更大参数规模模型,综合性能领先。其分步生成策略可从单一物体扩展至完整场景,为世界模拟器提供丰富3D环境支持。项目主页及体验入口已开放。
原文链接
7月22日,AMD宣布与Stability AI合作推出全球首款采用BF16精度格式的Stable Diffusion 3 Medium开源图片生成模型。该模型专为AMD锐龙AI 300/锐龙AI Max 300系列处理器中的XDNA 2架构NPU优化,需24GB系统内存和9GB运行内存,可在总内存不足32GB的笔记本上实现高质量本地图片生成。此外,搭载XDNA 2 NPU的平台支持超分辨率功能,可将生成的1024×1024图像增强至2048×2048。用户仅需三步即可完成本地部署:安装最新版AMD Software: Adrenalin Edition、Amuse 3.1 Beta,并在Amuse中切换至“XDNA 2 Stable Diffusion Offload”。
原文链接
谷歌DeepMind推出文本生成新模型Gemini Diffusion,采用扩散技术,12秒可生成1万tokens,速度达2000tokens/秒,远超传统自回归模型。该模型通过逐步优化噪声生成输出,不仅能快速迭代,还能在生成过程中进行错误修正,适用于代码编辑及数学推理等任务。例如,在非因果推理测试中,Gemini Diffusion能同时生成完整答案及推导过程,而GPT-4o等自回归模型难以完成此类任务。目前,Gemini Diffusion仍处于实验阶段,用户可通过官方链接申请体验。这项技术可能预示未来混合模型的发展趋势,值得关注。
原文链接
标题:速度秒杀GPT们10倍,国外的DeepSeek时代来了?
前几天,一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。
Mercury在多项测试中表现亮眼,其生成速度比...
原文链接
Stability AI 近日发布开源文生图模型Stable Diffusion 3.5,共提供Medium(10月29日发布)、Large和Large Turbo三种规模版本,以满足不同用户需求。其中,Large版本拥有80亿参数,专为专业场景设计;Turbo版本则是Large的简化版,优化了生成速度。Medium版本则具备25亿参数,采用MMDiT-X架构,预计10月29日上线,目标是在消费级硬件上实现“开箱即用”。尽管如此,Stability AI表示此次发布尚未完全达到预期,后续将继续优化。该系列模型均采用宽松社区许可,允许非商业用途免费使用,并对年收入低于100万美元的企业开放,超出门槛的企业需另行协商。
原文链接
Runway,一家知名AI视频创企,突然从Hugging Face和GitHub两大开源社区上清空了其开源模型,仅留下“404”和一段注释,表明已不再维护Hugging Face组织。这一行动引发了外界猜测,推测原因可能与Stability AI的利益纠纷或涉及侵权问题“销毁证据”有关。在官方未回应...
原文链接
标题:FLUX与Midjourney:图像AI的新竞争者
正文:
曾经与DALL·E、Midjourney齐名的图像生成AI Stable Diffusion,因内部动荡陷入困境。然而,其前团队成员在年初成立了Black Forest Lab(黑森林实验室),并迅速发布了三个图像生成模型——FLUX...
原文链接
AI图像与视频生成领域迎来新力量!原Stability AI研究科学家Robin Rombach宣布成立Black Forest Labs,携前同事共同创业。团队汇聚AI领域顶尖人才,拥有丰富成果,如VQGAN、Latent Diffusion、Stable Diffusion等。Black For...
原文链接
黑森林实验室,由Stable Diffusion的核心团队成员创建,今日宣布成立。该实验室推出了FLUX.1系列图像生成模型,包括pro、dev和schnell三个版本,分别在性能、效率和速度上各有侧重。其中,pro版本在视觉质量、提示响应度、尺寸灵活性、排版和输出多样性方面,超越了竞品如Midjourney v6.0、DALL·E 3 HD和Stable Diffusion 3-Ultra。黑森林实验室表示,其目标是提供先进的图像和视频生成深度学习模型,并在广泛受众中普及。此外,黑森林实验室宣布已完成3200万美元的融资,由a16z领投,多位行业大佬参与投资。随着新模型的发布,黑森林实验室还展示了其在视频生成领域的野心,计划推出“SOTA”级别的产品。
原文链接
加载更多
暂无内容