
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:北京人形WoW具身世界模型引领机器人新突破
近年来,机器人在运动能力上快速进步,如后空翻、跑酷等复杂动作已不在话下。然而,让机器人理解物理现象,比如水杯倒下后水为何洒出,依然是巨大挑战。近日,北京人形机器人创新中心开源了全新世界模型架构——WoW(World-Omniscient Worl...
原文链接
2025年10月17日,工信部装备工业一司副司长郭守刚在世界智能网联汽车大会上表示,未来将完善政策法规,制定十五五智能网联新能源汽车产业规划。工信部将强化对搭载组合驾驶辅助系统车辆的生产一致性监管,规范企业OTA升级活动,推动机动车生产准入管理条例出台,并完善企业退出机制。同时,协同相关部门推进准入管理、交通管理、网络安全等领域的法律法规制修订,压实企业主体责任,确保产业健康发展。(财联社记者 徐昊)
原文链接
正文:9月29日,阿里通义千问发布Qwen-Image-Edit-2509模型更新,现于HuggingFace和魔搭社区开源,并可通过Qwen Chat免费体验。新版支持多图编辑(如“人物+人物”“人物+商品”“人物+场景”等),显著提升单图一致性(包括人脸、商品、文字编辑)。此外,新增原生支持ControlNet功能,可基于深度图、边缘图等进行操作。此次更新强化了多场景适配能力,适用于海报设计、老照片修复、表情包制作等任务。
原文链接
9月22日晚间,DeepSeek宣布其线上模型升级至V3.1-Terminus版本,包含思考模式和非思考模式,上下文长度均为128k。此次更新改进了语言一致性和Agent能力,缓解中英文混杂及异常字符问题,并优化Code Agent与Search Agent表现。非思考模式输出默认4K(最大8K),思考模式默认32K(最大64K)。使用价格为百万tokens输入缓存命中0.5元、未命中4元,输出12元。用户可在线体验新版功能。
原文链接
9月15日,河南省发布《河南省加快人工智能赋能新型工业化行动方案(2025—2027年)》,提出在现代医药产业领域加强人工智能应用。重点包括利用大模型优化药物筛选、临床试验设计及合成工艺,提升药品研发效率与质量。同时,打通生物与医疗健康数据壁垒,强化中医药大模型构建,攻克中药产品一致性难题。此外,推动人工智能在辅助诊断、脑机混合、智能康复等领域的应用,提高医疗器械性能。方案展现了河南以AI赋能医药工业的规划与决心。
原文链接
2025年8月,杭州群核科技发布空间大模型,攻克了空间一致性难题,突破虚拟与现实技术壁垒。其模型SpatialLM1.5和SpatialGen具备真实感全息漫游、可交互性及复杂空间处理能力,解决了3D场景生成中视角扭曲、内容穿帮等问题。相比GPT-5在空间任务中的局限,群核模型能精准生成适合特定需求的空间布局,如适老家具摆放,并支持机器人路径规划等复杂任务。群核提出“三位一体”战略,结合空间编辑工具、合成数据和大模型,形成正向循环闭环,推动空间智能发展。此次开源旨在吸引开发者参与,加速行业生态构建。作为“杭州六小龙”之一,群核专注室内场景,开辟原生空间智能新路径,致力于成为全球空间智能基础设施。
原文链接
8月中旬,一款名为nano-banana的匿名模型在LMArena平台盲测中因惊人效果引发关注,用户争相测试。北京时间8月27日,谷歌认领该模型,正式发布为Gemini 2.5 Flash Image,可在Gemini app等平台使用。其核心技术亮点包括颠覆性一致性、自然语言驱动编辑和闪电速度响应。实测显示,模型在多图融合和一致性上表现优异,但部分任务如商品尺寸调整翻车。此次发布采用匿名盲测到官方认领策略,借助社区传播形成病毒式扩散,被称为“一致性之王”。这一模式为AI模型发布提供了新思路。
原文链接
8月26日,谷歌DeepMind发布Gemini 2.5 Flash图像编辑模型,支持基于文字指令的高精度修图,在多项任务中表现优于GPT-4o。新模型亮点包括“角色一致性”功能,可确保人物、动物或物体在多张图片中外观一致,适合批量制作品牌素材与产品目录。此外,它支持局部编辑、风格迁移以及简单因果推理(如生成气球撞向仙人掌的画面)。该功能已在Gemini应用上线,用户需切换至“Flash”模式使用,生成图像带水印。开发者可通过Gemini API等试用,费用为每百万token 30美元,单张图片约0.039美元。
原文链接
8月25日,群核科技在首届技术开放日发布空间大模型新成果:SpatialLM 1.5和SpatialGen。SpatialLM 1.5是一款支持对话生成结构化3D场景的语言模型,可解决机器人训练数据难题,已展示养老场景应用。SpatialGen则专注生成多视角一致图像,破解AI视频时空一致性问题,并计划推出全球首款深度融合3D能力的AI视频生成产品。两款模型逐步开源,SpatialGen已可下载,SpatialLM 1.5后续将以“SpatialLM-Chat”形式开源。群核科技还提出“空间智能飞轮”战略,推动空间智能生态发展。
原文链接
提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题
中科院自动化所张兆翔教授团队研发了一种名为TC-Light的生成式渲染器,能够为具身智能训练任务中的复杂运动长视频序列进行逼真的光照与纹理重渲染。该算法具备良好的时序一致性和低计算成本,可有效减少Sim2Real Ga...
原文链接
加载更多

暂无内容