12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。
原文链接
本文链接:https://kx.umi6.com/article/29809.html
转载请注明文章出处
相关推荐
换一换
9个案例实测谷歌Gemini文生图,设计行业“快变天了”
2025-03-13 20:36:23
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了
2025-05-16 17:18:33
Runway发布超逼真文生图模型—Frames
2024-11-28 10:22:21
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
2025-08-19 16:06:04
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025-10-29 09:42:14
苹果全能视觉 AI 模型 UniGen 1.5 亮相,看图、修图、绘图三合一
2025-12-19 08:35:06
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
2024-12-01 19:36:50
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025-08-23 18:04:04
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
2024-11-11 20:43:03
阶跃星辰开源图像编辑模型Step1X-Edit
2025-04-27 11:14:13
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
腾讯元宝宣布文生图功能升级:混元和 DeepSeek 都已支持生图
2025-05-07 17:15:44
字节跳动发布图像编辑模型SeedEdit 3.0
2025-06-06 16:38:41
659 文章
430155 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34