12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。
原文链接
本文链接:https://kx.umi6.com/article/29809.html
转载请注明文章出处
相关推荐
换一换
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
2024-12-01 19:36:50
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒
2025-04-19 15:47:04
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025-08-23 18:04:04
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
这个春节P图不求人!小红书开源图像编辑新SOTA
2026-02-12 20:41:16
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
2025-08-19 16:06:04
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
2025-12-25 17:49:41
谷歌最强文生图 AI 模型 Imagen 4 亮相:比上一代快 10 倍,文字效果更好
2025-05-21 03:50:10
字节Seedream 3.0追平GPT-4o 加入文生图第一梯队
2025-04-16 21:16:27
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
2025-06-06 16:37:39
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
719 文章
560074 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33