一致性 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

对标 Genie 3，蚂蚁灵波开源世界模型 LingBot-World，10分钟长视频无损生成

1月29日，蚂蚁灵波科技发布开源世界模型LingBot-World，对标Google Genie 3，在视频质量、动态程度、长时一致性等指标上表现优异。该模型支持近10分钟无损生成，解决“长时漂移”问题，适用于具身智能、自动驾驶和游戏开发。交互性能达16 FPS，延迟控制在1秒内，用户可通过键盘或鼠标实时操控角色与视角，并通过文本触发环境变化。模型具备Zero-shot泛化能力，仅需一张照片即可生成可交互视频流，降低部署成本。训练数据采用混合采集策略，覆盖多样化场景并提取纯净画面。LingBot-World为复杂长程任务提供低成本试错空间，助力智能体场景理解与泛化能力提升。目前，模型权重及推理代码已开源，推动AGI生态共建。

原文链接

AGI探路者

01-29 13:19:39

LingBot-World

具身智能

长时一致性

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌 Veo 3.1 视频 AI 模型发布：强化场景一致性、支持 9:16 纵向比例适配移动端

1月14日，谷歌发布Veo 3.1视频AI模型，强化场景一致性并优化移动端适配。新模型提升“图像要素”生成能力，增强故事表达和场景切换中角色、叙事的连贯性，支持背景、纹理等素材跨场景复用，自然融合无关素材以生成更震撼的效果。同时，Veo 3.1新增9:16纵向比例，专为手机竖屏设计，满足短视频平台需求，并提供超分辨率功能，支持输出1080p至4K高质量视频内容。

原文链接

量子黑客

01-14 09:21:22

场景一致性

移动端适配

谷歌Veo 3.1

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源，支持两人隔空“合照”

12月25日，阿里通义千问宣布开源图像编辑AI模型Qwen-Image-Edit-2511。该版本在角色一致性、工业设计能力及几何推理能力等方面进行了显著提升，尤其在多人合照生成中表现优异，可实现两张人物照片的高质量合照效果。此外，新模型集成了Lora能力，支持打光、多场景应用等特效，并可直接生成辅助线效果，适用于工业产品设计与材质替换等工程场景。Qwen-Image-Edit-2511已在ModelScope和Hugging Face平台开源，为开发者提供强大工具。

原文链接

AI奇点纪元

12-25 17:49:41

Qwen-Image-Edit-2511

图像编辑

角色一致性

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯混元世界模型 1.5 发布，首次开源业界最系统、最全面的实时世界模型框架

12月17日，腾讯正式发布混元世界模型1.5（Tencent HY WorldPlay），首次开源业界最系统、最全面的实时世界模型框架。该模型支持实时交互生成、长范围3D一致性及多样化交互体验，可实现24帧/秒高清视频生成，并具备空间记忆能力，能构建高质量3D空间模拟器。技术上，模型依托双分支动作表征、上下文记忆重构机制等三大创新，破解了实时性与几何一致性的难题。此次开源涵盖数据、训练、推理部署全链路，为AI游戏开发、影视制作、虚拟现实及具身智能研究提供全新工具。在线体验及代码已上线。

原文链接

蝶舞CyberSwirl

12-17 14:45:11

3D一致性

实时世界模型

腾讯混元世界模型

分享至

打开微信扫一扫

内容投诉

生成图片

Sora 2 之后，北京人形WoW具身世界模型带来aha时刻

标题：北京人形WoW具身世界模型引领机器人新突破近年来，机器人在运动能力上快速进步，如后空翻、跑酷等复杂动作已不在话下。然而，让机器人理解物理现象，比如水杯倒下后水为何洒出，依然是巨大挑战。近日，北京人形机器人创新中心开源了全新世界模型架构——WoW（World-Omniscient Worl...

原文链接

智慧轨迹

10-17 18:26:42

WoW具身世界模型

开源开放

物理一致性

分享至

打开微信扫一扫

内容投诉

生成图片

工信部郭守刚：强化对搭载组合驾驶辅助系统车辆生产一致性监督管理

2025年10月17日，工信部装备工业一司副司长郭守刚在世界智能网联汽车大会上表示，未来将完善政策法规，制定十五五智能网联新能源汽车产业规划。工信部将强化对搭载组合驾驶辅助系统车辆的生产一致性监管，规范企业OTA升级活动，推动机动车生产准入管理条例出台，并完善企业退出机制。同时，协同相关部门推进准入管理、交通管理、网络安全等领域的法律法规制修订，压实企业主体责任，确保产业健康发展。（财联社记者徐昊）

原文链接

超频思维站

10-17 10:13:03

政策法规

智能网联汽车

生产一致性

分享至

打开微信扫一扫

内容投诉

生成图片

阿里 Qwen-Image-Edit-2509 模型更新发布，支持多图编辑、单图一致性提升

正文：9月29日，阿里通义千问发布Qwen-Image-Edit-2509模型更新，现于HuggingFace和魔搭社区开源，并可通过Qwen Chat免费体验。新版支持多图编辑（如“人物+人物”“人物+商品”“人物+场景”等），显著提升单图一致性（包括人脸、商品、文字编辑）。此外，新增原生支持ControlNet功能，可基于深度图、边缘图等进行操作。此次更新强化了多场景适配能力，适用于海报设计、老照片修复、表情包制作等任务。

原文链接

星际Code流浪者

09-29 20:13:53

Qwen-Image-Edit-2509

单图一致性

多图编辑

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek 线上模型升级至 V3.1-Terminus 版本，改进语言一致性及 Agent 能力

9月22日晚间，DeepSeek宣布其线上模型升级至V3.1-Terminus版本，包含思考模式和非思考模式，上下文长度均为128k。此次更新改进了语言一致性和Agent能力，缓解中英文混杂及异常字符问题，并优化Code Agent与Search Agent表现。非思考模式输出默认4K（最大8K），思考模式默认32K（最大64K）。使用价格为百万tokens输入缓存命中0.5元、未命中4元，输出12元。用户可在线体验新版功能。

原文链接

电子诗篇

09-22 21:02:17

DeepSeek

模型升级

语言一致性

分享至

打开微信扫一扫

内容投诉

生成图片

河南：加强中医药大模型构建和训练攻克中药产品一致性难题

9月15日，河南省发布《河南省加快人工智能赋能新型工业化行动方案（2025—2027年）》，提出在现代医药产业领域加强人工智能应用。重点包括利用大模型优化药物筛选、临床试验设计及合成工艺，提升药品研发效率与质量。同时，打通生物与医疗健康数据壁垒，强化中医药大模型构建，攻克中药产品一致性难题。此外，推动人工智能在辅助诊断、脑机混合、智能康复等领域的应用，提高医疗器械性能。方案展现了河南以AI赋能医药工业的规划与决心。

原文链接

灵感Phoenix

09-15 18:02:53

中医药大模型

中药产品一致性

人工智能赋能

分享至

打开微信扫一扫

内容投诉

生成图片

空间智能卡脖子难题被杭州攻克！难倒GPT-5后，六小龙企业出手了

2025年8月，杭州群核科技发布空间大模型，攻克了空间一致性难题，突破虚拟与现实技术壁垒。其模型SpatialLM1.5和SpatialGen具备真实感全息漫游、可交互性及复杂空间处理能力，解决了3D场景生成中视角扭曲、内容穿帮等问题。相比GPT-5在空间任务中的局限，群核模型能精准生成适合特定需求的空间布局，如适老家具摆放，并支持机器人路径规划等复杂任务。群核提出“三位一体”战略，结合空间编辑工具、合成数据和大模型，形成正向循环闭环，推动空间智能发展。此次开源旨在吸引开发者参与，加速行业生态构建。作为“杭州六小龙”之一，群核专注室内场景，开辟原生空间智能新路径，致力于成为全球空间智能基础设施。

原文链接