
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Black Forest Labs近日开源了其旗舰图像编辑模型FLUX.1 Kontext[dev],该模型仅含120亿参数,推理速度快且能在消费级硬件上运行,性能媲美GPT-image-1等闭源模型。FLUX.1 Kontext[dev]支持文本引导的本地与全局图像编辑、多次连续优化,并特别为NVIDIA Blackwell架构进行优化,提供BF16、FP8和FP4权重变体,显著提升推理效率。实验表明,其在KontextBench基准测试中表现优于Bytedance Bagel、HiDream-E1-Full及GPT-image-1等模型。用户可在Hugging Face平台试用该模型,反馈显示其在H100 GPU上5秒内即可完成任务,成本低至0.0067美元。尽管在MacBook Pro上运行较慢,但社区已尝试结合LoRA开发个性化应用。
原文链接
标题:拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
昨夜,阿里推出全新多模态模型Qwen-VLo,引发网友热议。该模型在图像生成和编辑方面表现出色,具备三大亮点:增强的细节捕捉能力、一句话即可完成图像编辑(如风格替换、素材增删、添加文字),以及支持中英等多语言。同时,Qwen-...
原文链接
标题:知识类型视角评测图像编辑模型推理能力:程序性推理表现欠佳
东南大学联合多家机构提出KRIS-Bench,从知识类型角度系统评测图像编辑模型的推理能力。KRIS-Bench涵盖事实性、概念性和程序性三种知识类型,细分为7大推理维度、22种任务,覆盖从初级到高级的全谱系难度。样本总量达1,26...
原文链接
《科创板日报》6日消息,字节跳动Seed团队推出图像编辑模型SeedEdit 3.0。该模型支持4K图像处理与生成,能精准自然编辑区域,同时保持其他信息高保真。未来,团队计划提升编辑性能,并拓展更多功能,包括多图生成、图像合成及故事性内容创作等。
原文链接
6月6日,字节跳动Seed团队发布图像编辑模型SeedEdit 3.0,已在即梦网页端开启测试,豆包App也将上线。该模型基于Seedream 3.0,通过多样化数据融合及特定奖励模型,提升了主体、背景及细节保持能力,尤其在人像编辑、背景更换、光影转换等场景表现优异。SeedEdit 3.0可处理4K图像,精准区分编辑与保留区域,例如移除行人时连影子也可去除,同时保持绘画转真实模特的细节如衣帽、手提包等。团队采用高效数据融合策略及多种奖励模型,优化了人脸对齐、文本渲染等关键任务,并对推理加速同步改进。未来,该模型将进一步探索连续多图生成、图像合成及故事性内容生成等功能。
原文链接
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
RISEBench团队投稿,量子位 | 公众号QbitAI报道。GPT-4o-Image在图像编辑新基准中仅完成28.9%任务,暴露出多模态模型在复杂图像编辑中的不足。
上海人工智能实验室...
原文链接
谷歌于5月1日宣布,Gemini聊天机器人应用新增本地图像编辑功能,支持修改AI生成图像及用户上传的图片。该功能已开始全球推送,预计未来几周覆盖多数国家并支持超45种语言。此功能紧随谷歌3月在AI Studio平台上测试的图像编辑模型,后者因可移除水印受到关注。Gemini编辑器可生成更丰富的上下文响应,用户能轻松调整背景、替换物品等。例如,用户可上传个人照请求生成不同发色效果,或创作龙的睡前故事并配图。为回应公众担忧,谷歌称Gemini生成图像将带有不可见水印,并试验添加可见水印。
原文链接
今日,阶跃星辰发布通用图像编辑模型Step1X-Edit,支持11类常见图像编辑任务,如文字替换、人物美化、风格迁移等,用户可免费通过阶跃AI App和网页端(stepfun.com)使用。该模型参数量达19B,具备语义解析、身份一致性和高精度控制能力,并通过自研基准测试集GEDit-Bench验证,多项指标达开源SOTA水平。Step1X-Edit已开源,支持GitHub、HuggingFace等平台调用。这是阶跃星辰近一个月发布的第三款多模态模型,其Step系列基座模型中多模态模型占比已达7成。
原文链接
4月27日,阶跃星辰开源图像编辑大模型Step1X-Edit,参数量达19B,性能达开源SOTA。该模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。Step1X-Edit可灵活处理多轮、多任务编辑需求,保留人脸、姿态等身份特征,实现精确的区域编辑与风格统一。开源地址:Github、HuggingFace、ModelScope、技术报告。
原文链接
4月27日,阶跃星辰宣布开源图像编辑大模型Step1X-Edit,性能达开源SOTA。该模型总参数量为19B(含7B MLLM和12B DiT),具备语义精准解析、身份一致性保持及高精度区域级控制三大能力。Step1X-Edit支持文字替换、风格迁移、材质变换、人物修图等11类常见图像编辑任务。
原文链接
加载更多

暂无内容