1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月8日,美团LongCat团队发布并开源图像生成模型LongCat-Image。该模型以6B参数规模,在文生图和图像编辑能力上逼近大尺寸模型效果,并在多个基准测试中达到开源SOTA水平。其亮点包括高度可控的图像编辑能力和精准覆盖中文文字生成,特别是在复杂汉字渲染与生僻字支持方面表现突出。通过渐进式学习、多任务联合训练及创新数据策略,模型在指令遵循、视觉一致性及纹理真实感等方面显著提升。客观评测显示,LongCat-Image在ImgEdit-Bench、GEdit-Bench等测试中领先开源模型,接近闭源头部模型。此外,美团全面开源了多阶段模型,鼓励开发者参与共建,推动视觉生成技术发展。项目已上线Hugging Face和GitHub。

原文链接
本文链接:https://kx.umi6.com/article/29809.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
神秘 AI 模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
2024-10-29 14:31:02
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
谷歌Gemini2.0新神技,难评
2025-03-17 22:00:35
字节跳动发布图像编辑模型SeedEdit 3.0
2025-06-06 16:38:41
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
2025-08-19 09:59:40
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
Runway发布超逼真文生图模型—Frames
2024-11-28 10:22:21
豆包支持带有指定文字的图片生成,App已开启测试
2024-12-06 13:22:39
腾讯元宝宣布文生图功能升级:混元和 DeepSeek 都已支持生图
2025-05-07 17:15:44
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
2024-11-30 23:20:09
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
2025-05-30 15:52:41
24小时热文
更多
扫一扫体验小程序