12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。
原文链接
本文链接:https://kx.umi6.com/article/29809.html
转载请注明文章出处
相关推荐
换一换
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍
2024-10-27 16:12:25
Runway全面开放新文生图模型Frames
2025-01-22 08:53:58
字节Seedream 3.0追平GPT-4o 加入文生图第一梯队
2025-04-16 21:16:27
修图 AI 模型 Qwen-Image-Edit-2511 开源上线:提升角色一致性、增强几何推理
2025-12-25 15:42:29
谷歌nano banana火爆出圈 AI应用有望站上市场风口
2025-09-01 08:15:00
全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
2025-08-19 07:53:42
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
2025-04-27 12:13:44
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
2024-11-30 23:20:09
百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉
2024-11-12 19:12:06
多模态又考验算力了!ChatGPT文生图功能太火爆 奥尔特曼:GPU“冒烟了”
2025-03-28 09:38:22
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025-10-29 09:42:14
清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
2026-04-22 15:20:13
754 文章
651588 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41