2025年11月,兔展智能与北京大学联合发布图像编辑模型UniWorld-V2,刷新多项SOTA成绩。该模型在中文细节控制和复杂指令理解上表现优异,例如精准修改手势、渲染艺术中文字体及实现精细化空间编辑。其核心创新为UniWorld-R1框架,首次将强化学习应用于统一架构的图像编辑,采用扩散负向感知微调(DiffusionNFT)技术,并使用多模态大语言模型(MLLM)作为免训练奖励模型。在GEdit-Bench和ImgEdit基准测试中,UniWorld-V2分别以7.83分和4.49分超越OpenAI的GPT-Image-1等顶尖模型。研究团队还公开了论文、代码及模型,供后续研究使用。
原文链接
本文链接:https://kx.umi6.com/article/27827.html
转载请注明文章出处
相关推荐
换一换
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
2026-01-07 16:15:48
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
2025-07-24 16:09:58
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
苹果全能视觉 AI 模型 UniGen 1.5 亮相,看图、修图、绘图三合一
2025-12-19 08:35:06
翁荔最新万字长文:Why We Think
2025-05-18 14:20:10
字节跳动发布图像编辑模型SeedEdit 3.0
2025-06-06 16:38:41
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
马斯克亲自点名Karpathy迎战Grok 5!别神话LLM,AGI还要等十年
2025-10-20 15:08:42
Gemini2.5弯道超车背后的灵魂人物
2025-06-05 11:52:48
谷歌nano banana火爆出圈 AI应用有望站上市场风口
2025-09-01 08:15:00
全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
2025-08-19 07:53:42
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
660 文章
412393 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34