1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
黑马图像模型被Nano Banana技术负责人点赞!15人华人小队,DDIM之父&CVPR最佳论文作者带队
2026年3月,Luma AI发布全新图像模型Uni-1,由不到15人的华人团队打造,正面对标谷歌Nano Banana Pro和GPT Image 1.5。Uni-1是一个统一的图像理解与生成模型,在角色姿态迁移、多参考图场景合成、草稿转漫画等任务中表现优异,部分能力达世界领先水平。团队核心成员包括DDIM之父宋佳铭和CVPR最佳论文作者沈博魁。Uni-1采用decoder-only自回归Transformer架构,将文本与图像表示在同一序列中,实现‘先想后画’的能力,并在RISEBench等基准测试中取得最优成绩。该模型不仅在生成任务中表现出色,还在传统理解任务上展现竞争力,获得谷歌DeepMind首席科学家Oliver Wang等业内专家点赞。Luma AI计划将这一框架扩展至视频、语音等领域,目标构建多模态统一系统。
数据炼金师
03-06 23:41:48
分享至
打开微信扫一扫
内容投诉
生成图片
硬刚谷歌 Nano Banana 模型:OpenAI 被曝正测试代号榛子 / 栗子两款生图 AI
12月10日,据消息源@marmaduke091爆料,OpenAI正在测试两款代号为“Hazelnut(榛子)”和“Chestnut(栗子)”的全新AI图像生成模型。这两款模型近期频繁出现在Design Arena和LM Arena等竞技平台,可能与传闻中的GPT-5.2一同发布。新模型在“图像内代码”渲染能力上取得突破,能更准确呈现清晰代码文本,同时在通用场景理解力上接近谷歌Nano Banana Pro模型。然而,人像生成质感仍需改进,面部皮肤纹理被指有明显“塑料感”。技术架构或基于GPT-4o而非最新的gpt-image-1,但具体细节尚待官方确认。
AI创意引擎
12-10 10:40:35
分享至
打开微信扫一扫
内容投诉
生成图片
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型
2025年8月,谷歌发布全新图像模型nano banana,引爆AI社区。该模型可融合多张图片生成全新画面,理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini技术,nano banana实现“有记忆”的多轮创作,具备极高一致性和创造力。用户可上传最多13张图片进行拼接,或标注现实场景中的地标建筑。模型还能从等高线生成地貌、渲染工程视图、定制试衣效果,并修复老照片。其背后技术包括多模态上下文处理与交错生成,灵感源于网友反馈和团队对文字渲染的执着。谷歌DeepMind团队透露,未来目标是让模型超越指令,提供更优创意解。目前,nano banana已在LMArena上线并获高度评价。
阿达旻
08-30 14:51:09
分享至
打开微信扫一扫
内容投诉
生成图片
Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了
Midjourney宣布入局视频生成领域,其图像模型V7持续更新,视频生成效果逼真,动作流畅且细节丰富,包括跑步、挖蛋糕、多人物动作切换等场景均表现出色。尽管如此,视频缺乏音频功能引发网友热议,质疑其入局时机。Midjourney强调区别于其他模型的独特“动画化图片”功能,并计划通过用户评分和建议完善视频模型。此外,Midjourney V7图像生成模型也不断迭代,新增“草稿模式”,可通过语音输入生成多张图像,大幅提升生成效率。团队承诺开放定价权,希望满足不同用户需求。目前,Midjourney视频模型仍在完善中,预计未来将与图像模型共同成为视觉技术领域的领军者。
E-Poet
06-17 15:24:04
分享至
打开微信扫一扫
内容投诉
生成图片
快手可图 1.5 图像模型发布:全新“AI 模特”功能上线
12月27日,快手宣布推出可图1.5图像模型,新功能包括“AI模特”,通过文本描述生成AI模特形象,结合AI换装和可灵1.6图生视频功能,可生成服装展示视频。此外,可灵1.5模型在高品质模式下支持“尾帧生成”功能,上传图片后可基于尾帧生成5秒或10秒的视频。可灵对口型功能新增10款高品质音色,并支持7种情感选择,使人物配音更加生动自然。
代码编织者Nexus
12-27 16:06:34
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序