1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。
AI创想团
12-08 10:19:43
LongCat-Image
图像编辑
文生图
分享至
打开微信扫一扫
内容投诉
生成图片
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025年11月,兔展智能与北京大学联合发布图像编辑模型UniWorld-V2,刷新多项SOTA成绩。该模型在中文细节控制和复杂指令理解上表现优异,例如精准修改手势、渲染艺术中文字体及实现精细化空间编辑。其核心创新为UniWorld-R1框架,首次将强化学习应用于统一架构的图像编辑,采用扩散负向感知微调(DiffusionNFT)技术,并使用多模态大语言模型(MLLM)作为免训练奖励模型。在GEdit-Bench和ImgEdit基准测试中,UniWorld-V2分别以7.83分和4.49分超越OpenAI的GPT-Image-1等顶尖模型。研究团队还公开了论文、代码及模型,供后续研究使用。
智慧棱镜
11-05 15:09:36
UniWorld-V2
图像编辑
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025年10月29日,苹果公司发布Pico-Banana-400K数据集,包含40万张图像,用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建,采用非商业性研究许可,供学术研究使用。苹果团队从OpenImages中选取多样化真实照片,并设计35种编辑指令,涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后,由Gemini 2.5-Pro进行质量评估,确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对,助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv,数据集在GitHub免费开放。
电子诗篇
10-29 09:42:14
Pico-Banana-400K
图像编辑
数据集
分享至
打开微信扫一扫
内容投诉
生成图片
Photoshop 又获一 AI 利器,本月将集成谷歌“最强 P 图模型”Nano Banana
9月12日,Adobe宣布谷歌的Nano Banana模型将于本月内集成到Photoshop。该模型将支持基于提示词的编辑,并结合Photoshop的选区、图层和蒙版等非破坏性工具。Nano Banana因避免“恐怖谷效应”且表现优异而爆火,上线后助力Gemini完成超2亿次图像编辑,吸引超1000万新用户。此前,Adobe在7月已推出多项AI功能测试,包括Generative Upscale和Remove等。这一合作将进一步提升Photoshop的AI修图能力。
跨界思维
09-12 16:14:22
AI图像编辑
Nano Banana
Photoshop
分享至
打开微信扫一扫
内容投诉
生成图片
AI“P 图”爆火出圈:“Nano Banana”一周为谷歌 Gemini 吸引千万新用户
9月5日,谷歌AI实验项目“Nano Banana”爆火,Gemini上线Gemini 2.5 Flash Image功能。谷歌实验室副总裁Josh Woodward透露,该功能已实现超2亿次图像编辑,吸引超1000万新用户。Nano Banana因避免“恐怖谷效应”、保持人物特征一致性而广受好评,其表现优于GPT-4o等竞品。目前,Gemini免费用户每日可编辑100次图像,付费用户可扩展至1000次。分析师认为,谷歌通过高质量工具吸引用户并引入Gemini生态的策略初见成效,展现了实际应用价值。
虚拟织梦者
09-05 08:12:32
AI图像编辑
Gemini
Nano Banana
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌nano banana火爆出圈 AI应用有望站上市场风口
当地时间8月26日,谷歌发布先进图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana),因惊艳效果迅速出圈。该模型支持多图拼接、地理与物理逻辑理解,可将二维地图转为三维景观,且能通过自然语言指令快速生成高分辨率图片,单张成本约0.3元人民币,效率大幅提升。其应用有望加速落地于电商、广告、设计等领域。相关上市公司中,虹软科技智能商拍平台PSAI于8月1日上线,主打“AI生成+修复”;万兴科技推出AI绘画软件万兴爱画,可在30秒内生成定制艺术作品。AI修图技术正站上市场风口。
DreamCoder
09-01 08:15:00
AI应用
Nano Banana
图像编辑
分享至
打开微信扫一扫
内容投诉
生成图片
Nano banana手办玩法火爆出圈!无需抽卡,效果惊了(°o°)
2025年8月,谷歌推出的Nano Banana(Gemini 2.5 Flash Image)图像编辑模型因生成逼真手办效果火爆出圈。用户无需抽卡即可生成1/7比例的手办模型,支持动漫角色、宠物及真人照片等多种参考图,细节表现惊人。该模型采用原生多模态与交错式生成技术,可处理复杂编辑任务,并通过文本渲染指标优化性能。团队基于用户反馈改进了像素级编辑、角色一致性等短板,显著提升质感与实用性。此外,谷歌宣布将于近期举办Nano Banana Hackathon活动,提供免费API额度和奖品。用户可通过AI Studio或Gemini API体验这一创新工具,掀起全网试玩热潮。
代码编织者
08-29 13:38:40
Nano Banana
图像编辑模型
手办玩法
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍
2025年8月26日,谷歌官方确认此前爆火的神秘图像编辑模型nano-banana实为Gemini 2.5 Flash Image。该模型具备强大的图像编辑能力,可合并多张图片生成新内容、实现超现实艺术创作及2D到3D转换,甚至展现高超的图像推理能力。用户现可在Gemini和Google AI Studio上免费使用,API价格为每张图像0.039美元。Nano-banana最初以匿名形式出现在LMArena竞赛平台,因表现优异引发广泛关注。谷歌表示,匿名发布是为全球规模发布做准备。尽管模型功能强大,但部分用户对其服务政策提出质疑。网友期待完整版发布,同时称其可能威胁传统图像编辑工具如Photoshop的地位。
虚拟织梦者
08-27 16:05:56
nano-banana
图像编辑
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
8月26日,谷歌DeepMind发布Gemini 2.5 Flash图像编辑模型,支持基于文字指令的高精度修图,在多项任务中表现优于GPT-4o。新模型亮点包括“角色一致性”功能,可确保人物、动物或物体在多张图片中外观一致,适合批量制作品牌素材与产品目录。此外,它支持局部编辑、风格迁移以及简单因果推理(如生成气球撞向仙人掌的画面)。该功能已在Gemini应用上线,用户需切换至“Flash”模式使用,生成图像带水印。开发者可通过Gemini API等试用,费用为每百万token 30美元,单张图片约0.039美元。
智能维度跳跃
08-27 09:00:44
Gemini 2.5 Flash
图像编辑
角色一致性
分享至
打开微信扫一扫
内容投诉
生成图片
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025年8月,代号为nano-banana的神秘AI图像编辑模型在海外社交媒体爆火,凭借强大的图片编辑能力引发热议。该模型可自由修改图片中的人物、背景甚至细节,生成效果逼真无AI痕迹,被网友称为“真正的AI P图”。其特点包括角色一致性、光影逻辑合理、照片级逼真和风格转换自然。测试显示,nano-banana在多人合照提取、证件照生成及复杂光影处理上表现优异,远超其他模型。尽管官方来源未确认,但多方线索暗示其或为Google未公开项目,且可能与Pixel 10系列的AI工具Ask Photos相关。此外,Google正测试垂直视频生成功能,预计将进一步整合nano-banana技术。
量子思考者
08-23 18:04:04
AI生成
nano-banana
图像编辑
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序