1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
图像界的DeepSeek!12B参数对标GPT-4o,消费级硬件玩转编辑生成
Black Forest Labs近日开源了其旗舰图像编辑模型FLUX.1 Kontext[dev],该模型仅含120亿参数,推理速度快且能在消费级硬件上运行,性能媲美GPT-image-1等闭源模型。FLUX.1 Kontext[dev]支持文本引导的本地与全局图像编辑、多次连续优化,并特别为NVIDIA Blackwell架构进行优化,提供BF16、FP8和FP4权重变体,显著提升推理效率。实验表明,其在KontextBench基准测试中表现优于Bytedance Bagel、HiDream-E1-Full及GPT-image-1等模型。用户可在Hugging Face平台试用该模型,反馈显示其在H100 GPU上5秒内即可完成任务,成本低至0.0067美元。尽管在MacBook Pro上运行较慢,但社区已尝试结合LoRA开发个性化应用。
蝶舞CyberSwirl
07-01 10:52:29
FLUX.1 Kontext[dev]
图像编辑
消费级硬件
分享至
打开微信扫一扫
内容投诉
生成图片
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
标题:拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩 昨夜,阿里推出全新多模态模型Qwen-VLo,引发网友热议。该模型在图像生成和编辑方面表现出色,具备三大亮点:增强的细节捕捉能力、一句话即可完成图像编辑(如风格替换、素材增删、添加文字),以及支持中英等多语言。同时,Qwen-...
代码编织者
06-28 13:21:34
Qwen-VLo
图像编辑
多模态模型
分享至
打开微信扫一扫
内容投诉
生成图片
知识类型视角切入,全面评测图像编辑模型推理能力:所有模型在「程序性推理」方面表现不佳
标题:知识类型视角评测图像编辑模型推理能力:程序性推理表现欠佳 东南大学联合多家机构提出KRIS-Bench,从知识类型角度系统评测图像编辑模型的推理能力。KRIS-Bench涵盖事实性、概念性和程序性三种知识类型,细分为7大推理维度、22种任务,覆盖从初级到高级的全谱系难度。样本总量达1,26...
小阳哥
06-13 15:08:40
KRIS-Bench
图像编辑模型
推理能力
分享至
打开微信扫一扫
内容投诉
生成图片
字节跳动发布图像编辑模型SeedEdit 3.0
《科创板日报》6日消息,字节跳动Seed团队推出图像编辑模型SeedEdit 3.0。该模型支持4K图像处理与生成,能精准自然编辑区域,同时保持其他信息高保真。未来,团队计划提升编辑性能,并拓展更多功能,包括多图生成、图像合成及故事性内容创作等。
星际Code流浪者
06-06 16:38:41
SeedEdit 3.0
图像编辑
字节跳动
分享至
打开微信扫一扫
内容投诉
生成图片
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
6月6日,字节跳动Seed团队发布图像编辑模型SeedEdit 3.0,已在即梦网页端开启测试,豆包App也将上线。该模型基于Seedream 3.0,通过多样化数据融合及特定奖励模型,提升了主体、背景及细节保持能力,尤其在人像编辑、背景更换、光影转换等场景表现优异。SeedEdit 3.0可处理4K图像,精准区分编辑与保留区域,例如移除行人时连影子也可去除,同时保持绘画转真实模特的细节如衣帽、手提包等。团队采用高效数据融合策略及多种奖励模型,优化了人脸对齐、文本渲染等关键任务,并对推理加速同步改进。未来,该模型将进一步探索连续多图生成、图像合成及故事性内容生成等功能。
虚拟微光
06-06 16:37:39
SeedEdit 3.0
图像编辑
字节跳动
分享至
打开微信扫一扫
内容投诉
生成图片
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题 RISEBench团队投稿,量子位 | 公众号QbitAI报道。GPT-4o-Image在图像编辑新基准中仅完成28.9%任务,暴露出多模态模型在复杂图像编辑中的不足。 上海人工智能实验室...
阿达旻
05-30 15:52:41
RISEBench
图像编辑
视觉理解
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图
谷歌于5月1日宣布,Gemini聊天机器人应用新增本地图像编辑功能,支持修改AI生成图像及用户上传的图片。该功能已开始全球推送,预计未来几周覆盖多数国家并支持超45种语言。此功能紧随谷歌3月在AI Studio平台上测试的图像编辑模型,后者因可移除水印受到关注。Gemini编辑器可生成更丰富的上下文响应,用户能轻松调整背景、替换物品等。例如,用户可上传个人照请求生成不同发色效果,或创作龙的睡前故事并配图。为回应公众担忧,谷歌称Gemini生成图像将带有不可见水印,并试验添加可见水印。
幻彩逻辑RainbowLogic
05-01 17:30:47
Gemini
图像编辑
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
今日,阶跃星辰发布通用图像编辑模型Step1X-Edit,支持11类常见图像编辑任务,如文字替换、人物美化、风格迁移等,用户可免费通过阶跃AI App和网页端(stepfun.com)使用。该模型参数量达19B,具备语义解析、身份一致性和高精度控制能力,并通过自研基准测试集GEDit-Bench验证,多项指标达开源SOTA水平。Step1X-Edit已开源,支持GitHub、HuggingFace等平台调用。这是阶跃星辰近一个月发布的第三款多模态模型,其Step系列基座模型中多模态模型占比已达7成。
星际Code流浪者
04-27 15:20:13
图像编辑模型
多模态模型
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
4月27日,阶跃星辰开源图像编辑大模型Step1X-Edit,参数量达19B,性能达开源SOTA。该模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。Step1X-Edit可灵活处理多轮、多任务编辑需求,保留人脸、姿态等身份特征,实现精确的区域编辑与风格统一。开源地址:Github、HuggingFace、ModelScope、技术报告。
阿达旻
04-27 12:13:44
Step1X-Edit
图像编辑
身份一致性
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源图像编辑模型Step1X-Edit
4月27日,阶跃星辰宣布开源图像编辑大模型Step1X-Edit,性能达开源SOTA。该模型总参数量为19B(含7B MLLM和12B DiT),具备语义精准解析、身份一致性保持及高精度区域级控制三大能力。Step1X-Edit支持文字替换、风格迁移、材质变换、人物修图等11类常见图像编辑任务。
DreamCoder
04-27 11:14:13
Step1X-Edit
图像编辑
阶跃星辰
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序