12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。
原文链接
本文链接:https://kx.umi6.com/article/29809.html
转载请注明文章出处
相关推荐
换一换
谷歌最强文生图 AI 模型 Imagen 4 亮相:比上一代快 10 倍,文字效果更好
2025-05-21 03:50:10
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025-08-23 18:04:04
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
2025-05-30 15:52:41
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉
2024-11-12 19:12:06
阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
2025-12-25 17:49:41
AI文生图最大问题不存在了,最新Gemini2.0指哪改哪
2025-03-14 15:16:12
谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图
2025-05-01 17:30:47
图像界的DeepSeek!12B参数对标GPT-4o,消费级硬件玩转编辑生成
2025-07-01 10:52:29
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025-10-29 09:42:14
Runway发布超逼真文生图模型—Frames
2024-11-28 10:22:21
李彦宏最新发声:大模型基本消除幻觉 AI变得可用可信赖!
2024-11-12 11:04:12
一句话 P 图,字节跳动发布通用图像编辑模型 SeedEdit
2024-11-12 19:13:10
690 文章
482913 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18