2025年11月,兔展智能与北京大学联合发布图像编辑模型UniWorld-V2,刷新多项SOTA成绩。该模型在中文细节控制和复杂指令理解上表现优异,例如精准修改手势、渲染艺术中文字体及实现精细化空间编辑。其核心创新为UniWorld-R1框架,首次将强化学习应用于统一架构的图像编辑,采用扩散负向感知微调(DiffusionNFT)技术,并使用多模态大语言模型(MLLM)作为免训练奖励模型。在GEdit-Bench和ImgEdit基准测试中,UniWorld-V2分别以7.83分和4.49分超越OpenAI的GPT-Image-1等顶尖模型。研究团队还公开了论文、代码及模型,供后续研究使用。
原文链接
本文链接:https://kx.umi6.com/article/27827.html
转载请注明文章出处
相关推荐
换一换
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
2025-08-19 07:53:42
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2025-10-29 09:42:14
清华刘知远团队论文:在严格可控环境下重新回答「强化学习能否教会大模型新能力」丨ICLR 2026
2026-02-09 19:27:01
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
2025-05-14 15:16:49
马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
2025-11-18 15:24:50
740 文章
559137 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33