DiT - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Reddit 起诉 Perplexity，指控后者未经授权为 AI 抓取和使用数据

10月23日，Reddit起诉AI公司Perplexity及三家数据抓取企业，指控其未经授权通过谷歌搜索结果获取和使用Reddit论坛数据。Reddit此前已与谷歌、OpenAI达成数据使用协议，并于7月起诉另一家AI初创企业Anthropic。Reddit首席法律官Ben Lee指出，AI公司为获取优质人类内容正催生‘数据洗钱’经济，而Reddit成为主要目标因其拥有大规模活跃对话数据。Perplexity发言人回应称，公司坚持原则性做法，支持公众获取公共知识的权利，并强调其AI服务以准确性和开放性为核心，不会威胁公众利益。

原文链接

阿达旻

10-23 16:09:59

Perplexity

数据抓取

分享至

打开微信扫一扫

内容投诉

生成图片

阿里 Qwen-Image-Edit-2509 模型更新发布，支持多图编辑、单图一致性提升

正文：9月29日，阿里通义千问发布Qwen-Image-Edit-2509模型更新，现于HuggingFace和魔搭社区开源，并可通过Qwen Chat免费体验。新版支持多图编辑（如“人物+人物”“人物+商品”“人物+场景”等），显著提升单图一致性（包括人脸、商品、文字编辑）。此外，新增原生支持ControlNet功能，可基于深度图、边缘图等进行操作。此次更新强化了多场景适配能力，适用于海报设计、老照片修复、表情包制作等任务。

原文链接

星际Code流浪者

09-29 20:13:53

Qwen-Image-Edit-2509

单图一致性

多图编辑

分享至

打开微信扫一扫

内容投诉

生成图片

大模型“精细化”对齐，真实性提升25.8%刷新SOTA！token级精准编辑，无需训练即插即用

标题：大模型“精细化”对齐，真实性提升25.8%刷新SOTA！token级精准编辑，无需训练即插即用正文：一种名为Token-Aware Editing (TAE)的新方法显著提升了大语言模型的对齐能力，在TruthfulQA任务上真实性指标提升25.8%，达到当前最优性能。TAE是一种无需...

原文链接

AGI探路者

09-27 13:41:13

Token-Aware Editing

大模型对齐

真实性提升

分享至

打开微信扫一扫

内容投诉

生成图片

引流 + 动态定价，消息称 Reddit 正与谷歌就新版 AI 合作协议展开谈判

9月22日消息，Reddit正与谷歌就新版AI合作协议展开谈判。距离双方首次达成数据授权合作已过去1.5年。据彭博社17日报道，Reddit希望优化流量转化，通过与谷歌产品团队合作，将更多通过AI搜索进入Reddit的用户转化为活跃用户，以扩大论坛生态流量。同时，Reddit也在探索为AI合作伙伴提供更高质量数据的方式。此外，Reddit认为此前的固定付费模式低估了其数据价值，计划推动动态定价机制，使其收入能随内容在AI答案中的重要性提升而增长。此举或为双方合作注入新动力。

原文链接

AI思维矩阵

09-22 17:00:21

动态定价

谷歌

分享至

打开微信扫一扫

内容投诉

生成图片

Reddit寻求与谷歌达成新一轮内容授权协议谋求动态定价分享AI红利

2025年9月18日，Reddit正与谷歌展开新一轮内容授权协议谈判，寻求更高收益和动态定价机制。此前，Reddit与谷歌的首份协议价值约6000万美元，现希望借助数据整合推动平台增长并为AI训练提供更多资源。Reddit还计划与OpenAI探讨类似合作模式，摆脱传统一次性授权方式。数据显示，Reddit内容在AI问答中被高频引用，但谷歌流量转化有限。与此同时，AI公司因数据使用引发法律争议，如纽约时报起诉OpenAI，Anthropic支付15亿美元达成版权和解。Reddit高管表示将持续评估其高价值数据的授权策略，目前与谷歌的讨论进展积极。

原文链接

元界筑梦师

09-18 02:41:35

内容授权协议

谷歌

分享至

打开微信扫一扫

内容投诉

生成图片

DiT突遭怒喷，谢赛宁淡定回应

2025年8月，扩散模型领域核心DiT遭网友质疑，称其数学、形式均错误，甚至怀疑其无Transformer。作者谢赛宁迅速回应，批评标题党行为并强调科学精神，指出评价需基于假设与实验。DiT融合Transformer与扩散模型，性能超越U-Net经典模型，广泛应用于图像视频生成。质疑者依据论文《TREAD》提出六点反驳，包括架构隐含特性及训练效率问题。谢赛宁否认Tread与“DiT是错的”有关，称其为正则化提升的结果，并推荐升级版Lightning DiT。他还总结团队改进方向，如内部表征学习方法REPA及相关技术优化，同时指出sd-vae是当前主要瓶颈。

原文链接

跨界思维

08-20 17:19:58

DiT

扩散模型

谢赛宁

分享至

打开微信扫一扫

内容投诉

生成图片

DiT在数学和形式上是错的？谢赛宁回应：不要在脑子里做科学

2025年8月，一篇关于DiT架构缺陷的帖子在社交媒体引发热议。博主引用论文指出，DiT存在隐性架构问题，如FID过早稳定、后层归一化不稳定及adaLN-zero限制表达能力等。DiT作者、纽约大学助理教授谢赛宁回应称，质疑需基于实验而非空想，并解释DiT的改进方向，包括Lightning DiT升级版和VA-VAE等方法。他承认DiT有硬伤，如sd-vae效率低，但强调其仍是当前主流架构。谢赛宁呼吁科学质疑应基于假设与验证，而非仅为吸引关注。

原文链接

代码编织者Nexus

08-20 13:13:44

DiT

TREAD

谢赛宁

分享至

打开微信扫一扫

内容投诉

生成图片

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

2025年8月19日，Qwen团队发布新模型Qwen-Image-Edit，实现精准图像编辑。该工具支持‘哪里不对改哪里’的操作，包括文字修改、元素增删改、IP编辑、视角切换及风格迁移等功能。测试显示，无论是语义编辑（如IP形象衍生）、外观调整（如新增指示牌、改颜色）还是电商场景（模特换装、背景替换），均表现出色。此外，其链式编辑功能可逐步修复图片瑕疵，甚至支持偏旁级别的书法作品修正。Qwen-Image-Edit结合Qwen2.5-VL和VAEEncoder技术，满足创意与精准双重需求。目前，模型已上线Hugging Face、Qwenchat及GitHub供用户体验。

原文链接

代码编织者Nexus

08-19 16:06:04

Qwen-Image-Edit

图像编辑

链式编辑

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义千问：推出图像编辑模型Qwen-Image-Edit

8月19日，通义千问发布图像编辑模型Qwen-Image-Edit。该模型基于20B参数的Qwen-Image进一步训练，将文本渲染能力扩展至图像编辑领域，可精准编辑图片中的文字内容。这一新功能提升了图像处理的灵活性和效率，为用户提供了更强大的视觉内容创作工具。

原文链接

AI创意引擎

08-19 09:59:40

Qwen-Image-Edit

图像编辑

通义千问

分享至

打开微信扫一扫

内容投诉

生成图片

全能图像编辑 AI 模型 Qwen-Image-Edit 发布：哪里不对改哪里，文字也能随心换

8月19日，通义千问Qwen发布全新AI模型Qwen-Image-Edit，可精准编辑图片中的文字并实现语义与外观双重编辑。新模型基于20B参数的Qwen-Image训练，支持中英文双语文本编辑、风格迁移、物体旋转、IP创作等功能，适用于多种图像处理场景。例如，能对人物背景、服装进行调整，删除细小物体或修改特定元素。此外，Qwen-Image-Edit还支持链式编辑，逐步修正复杂书法作品中的错误。官方称其在多个基准测试中表现出SOTA性能。用户可通过Qwen Chat（chat.qwen.ai）体验该功能。开源地址已公布于ModelScope、Hugging Face和GitHub平台。

原文链接