1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了
2025年8月,杭州群核科技发布空间大模型,攻克了空间一致性难题,突破虚拟与现实技术壁垒。其模型SpatialLM1.5和SpatialGen具备真实感全息漫游、可交互性及复杂空间处理能力,解决了3D场景生成中视角扭曲、内容穿帮等问题。相比GPT-5在空间任务中的局限,群核模型能精准生成适合特定需求的空间布局,如适老家具摆放,并支持机器人路径规划等复杂任务。群核提出“三位一体”战略,结合空间编辑工具、合成数据和大模型,形成正向循环闭环,推动空间智能发展。此次开源旨在吸引开发者参与,加速行业生态构建。作为“杭州六小龙”之一,群核专注室内场景,开辟原生空间智能新路径,致力于成为全球空间智能基础设施。
心智奇点
08-28 11:17:24
空间一致性
空间智能
群核科技
分享至
打开微信扫一扫
内容投诉
生成图片
没有发布会,没有CEO站台,谷歌用一根“香蕉”赢得了欢呼
8月中旬,一款名为nano-banana的匿名模型在LMArena平台盲测中因惊人效果引发关注,用户争相测试。北京时间8月27日,谷歌认领该模型,正式发布为Gemini 2.5 Flash Image,可在Gemini app等平台使用。其核心技术亮点包括颠覆性一致性、自然语言驱动编辑和闪电速度响应。实测显示,模型在多图融合和一致性上表现优异,但部分任务如商品尺寸调整翻车。此次发布采用匿名盲测到官方认领策略,借助社区传播形成病毒式扩散,被称为“一致性之王”。这一模式为AI模型发布提供了新思路。
星际Code流浪者
08-28 10:21:15
Gemini 2.5 Flash Image
nano-banana
一致性
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
8月26日,谷歌DeepMind发布Gemini 2.5 Flash图像编辑模型,支持基于文字指令的高精度修图,在多项任务中表现优于GPT-4o。新模型亮点包括“角色一致性”功能,可确保人物、动物或物体在多张图片中外观一致,适合批量制作品牌素材与产品目录。此外,它支持局部编辑、风格迁移以及简单因果推理(如生成气球撞向仙人掌的画面)。该功能已在Gemini应用上线,用户需切换至“Flash”模式使用,生成图像带水印。开发者可通过Gemini API等试用,费用为每百万token 30美元,单张图片约0.039美元。
智能维度跳跃
08-27 09:00:44
Gemini 2.5 Flash
图像编辑
角色一致性
分享至
打开微信扫一扫
内容投诉
生成图片
群核科技发布空间大模型,或解决视频生成时空一致性难题
8月25日,群核科技在首届技术开放日发布空间大模型新成果:SpatialLM 1.5和SpatialGen。SpatialLM 1.5是一款支持对话生成结构化3D场景的语言模型,可解决机器人训练数据难题,已展示养老场景应用。SpatialGen则专注生成多视角一致图像,破解AI视频时空一致性问题,并计划推出全球首款深度融合3D能力的AI视频生成产品。两款模型逐步开源,SpatialGen已可下载,SpatialLM 1.5后续将以“SpatialLM-Chat”形式开源。群核科技还提出“空间智能飞轮”战略,推动空间智能生态发展。
未来编码者
08-26 14:47:34
开源
时空一致性
空间大模型
分享至
打开微信扫一扫
内容投诉
生成图片
提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题
提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题 中科院自动化所张兆翔教授团队研发了一种名为TC-Light的生成式渲染器,能够为具身智能训练任务中的复杂运动长视频序列进行逼真的光照与纹理重渲染。该算法具备良好的时序一致性和低计算成本,可有效减少Sim2Real Ga...
WisdomTrail
07-20 15:06:59
时序一致性
生成式渲染器
计算效率
分享至
打开微信扫一扫
内容投诉
生成图片
这是我花9毛钱拍的《Meta老板砸钱把我从苹果挖走》
标题:9毛钱拍出《Meta老板砸钱把我从苹果挖走》 正文: 国产AI视频生成技术已进入全新阶段,仅需9毛钱和4张图片,就能制作出精良的短视频。以《Meta老板砸钱把我从苹果挖走》为例,这并非传统的“图生视频”,而是更灵活的创作方式。以往的AI工具只能基于首尾帧生成视频,细节难以把控,而现在的技术...
未来编码者
07-14 14:23:28
AI视频生成
Vidu Q1参考生视频
一致性
分享至
打开微信扫一扫
内容投诉
生成图片
AI也有幸运数字!从1-50随机选数字:各家答案竟惊人一致
7月2日,快科技报道,当被要求在1到50之间随机选择一个数字时,OpenAI的ChatGPT、Anthropic的Claude Sonnet 4、谷歌的Gemini 2.5 Flash和Meta的Llama 4等主流AI模型不约而同选择了27。这一现象可能源于相似的训练数据和语言习惯,导致模型在预测时表现出一致性。测试显示,多数模型在不同范围内有固定的偏好数字,如1-10中倾向选7,1-5中偏好3或4,且多数为质数。该现象由数据科学家Mohd Faraaz首次发现,仅Grok选择了42。
数据炼金师
07-02 19:10:00
ai
数字偏好
模型一致性
分享至
打开微信扫一扫
内容投诉
生成图片
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
4月27日,阶跃星辰开源图像编辑大模型Step1X-Edit,参数量达19B,性能达开源SOTA。该模型具备语义精准解析、身份一致性保持及高精度区域级控制三大能力,支持文字替换、风格迁移等11类高频图像编辑任务。Step1X-Edit可灵活处理多轮、多任务编辑需求,保留人脸、姿态等身份特征,实现精确的区域编辑与风格统一。开源地址:Github、HuggingFace、ModelScope、技术报告。
阿达旻
04-27 12:13:44
Step1X-Edit
图像编辑
身份一致性
分享至
打开微信扫一扫
内容投诉
生成图片
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题 腾讯混元与InstantX团队合作推出开源插件InstantCharacter,实现定制化角色生成。该插件基于DiTs(Diffusion Transformers),能高效生成并编辑个性化角色图像。 传统方法存在...
数字墨迹
04-25 17:17:07
InstantCharacter
开源图像生成框架
角色一致性
分享至
打开微信扫一扫
内容投诉
生成图片
Runway Gen-4深夜发布,终于捅破AI视频多年的天花板
Runway Gen-4深夜发布,捅破AI视频多年天花板 这是一个导演酝酿十余年的梦想,如今借助AI得以实现。此前,用AI完成此视频需解决角色连贯性、情感细腻度、物理真实感及叙事连续性等难题。Runway Gen-4的到来改变了这一切,这款号称全球首款“世界一致性”模型,让用户能在多个场景中保持...
代码编织者Nexus
04-01 09:19:50
AI视频生成
Runway Gen-4
世界一致性
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序