1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型
2025年8月,谷歌发布全新图像模型nano banana,引爆AI社区。该模型可融合多张图片生成全新画面,理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini技术,nano banana实现“有记忆”的多轮创作,具备极高一致性和创造力。用户可上传最多13张图片进行拼接,或标注现实场景中的地标建筑。模型还能从等高线生成地貌、渲染工程视图、定制试衣效果,并修复老照片。其背后技术包括多模态上下文处理与交错生成,灵感源于网友反馈和团队对文字渲染的执着。谷歌DeepMind团队透露,未来目标是让模型超越指令,提供更优创意解。目前,nano banana已在LMArena上线并获高度评价。
阿达旻
08-30 14:51:09
Gemini
Nano Banana
图像模型
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌Nano Banana全网刷屏,起底背后团队
2025年8月,谷歌DeepMind团队在最新开发者节目中展示了Gemini 2.5 Flash Image模型,该模型具备原生图像生成与编辑能力,支持多轮对话式场景一致性操作,堪称图像生成领域的革命性突破。其亮点包括创意解读模糊指令、文本渲染改进及复杂任务的交错生成机制,适用于家居设计、人物OOTD等场景。团队核心成员包括Logan Kilpatrick、Kaushik Shivakumar、Robert Riachi、Nicole Brichtova和Mostafa Dehghani,他们在AI、多模态学习等领域有深厚积累。相比专注文本到图像的Imagen,Gemini更适合复杂多模态任务,未来目标是迈向通用人工智能(AGI)。
像素宇宙
08-29 12:39:40
Gemini 2.5 Flash Image
Google DeepMind
交错生成
分享至
打开微信扫一扫
内容投诉
生成图片
没有发布会,没有CEO站台,谷歌用一根“香蕉”赢得了欢呼
8月中旬,一款名为nano-banana的匿名模型在LMArena平台盲测中因惊人效果引发关注,用户争相测试。北京时间8月27日,谷歌认领该模型,正式发布为Gemini 2.5 Flash Image,可在Gemini app等平台使用。其核心技术亮点包括颠覆性一致性、自然语言驱动编辑和闪电速度响应。实测显示,模型在多图融合和一致性上表现优异,但部分任务如商品尺寸调整翻车。此次发布采用匿名盲测到官方认领策略,借助社区传播形成病毒式扩散,被称为“一致性之王”。这一模式为AI模型发布提供了新思路。
星际Code流浪者
08-28 10:21:15
Gemini 2.5 Flash Image
nano-banana
一致性
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌正式发布图像生成模型Gemini 2.5 Flash Image
8月26日,谷歌发布其最新图像生成与编辑模型Gemini 2.5 Flash Image(代号“纳米香蕉”)。该模型在LMArena基准测试中排名AI图像编辑模型榜首,支持角色一致性保持、自然语言修图及多图融合,并借助Gemini世界知识提升智能表现。用户可通过Gemini App或API访问,API定价为每百万输出token 30美元。据官方估算,生成单张图片约消耗1290个输出token,成本约为0.039美元。这一工具的推出为图像创作和编辑领域带来全新可能性。
超频思维站
08-27 09:04:32
Gemini 2.5 Flash Image
图像生成模型
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
8月26日,谷歌DeepMind发布Gemini 2.5 Flash图像编辑模型,支持基于文字指令的高精度修图,在多项任务中表现优于GPT-4o。新模型亮点包括“角色一致性”功能,可确保人物、动物或物体在多张图片中外观一致,适合批量制作品牌素材与产品目录。此外,它支持局部编辑、风格迁移以及简单因果推理(如生成气球撞向仙人掌的画面)。该功能已在Gemini应用上线,用户需切换至“Flash”模式使用,生成图像带水印。开发者可通过Gemini API等试用,费用为每百万token 30美元,单张图片约0.039美元。
智能维度跳跃
08-27 09:00:44
Gemini 2.5 Flash
图像编辑
角色一致性
分享至
打开微信扫一扫
内容投诉
生成图片
坏了,我感觉手机把我当agent 了
10月3日,Google在Made by Google发布会上推出了Pixel 10系列手机,但产品表现令人失望。硬件方面缺乏亮点,影像能力有进有退,设计趋于保守,甚至被称为‘Pixel 9s’。发布会形式更像一场年会,未能清晰传达产品升级点。尽管搭载了强大的AI模型Gemini,但新功能如Camera Coach和Magic Cue等需用户手动触发,体验割裂,与用户对AI主动服务的期待相悖。Pixel 10更像是为Gemini打造的硬件载体,而非以人为中心的AI手机。这种设计可能引导其他厂商忽视硬件创新,偏离消费者期望,形成不良趋势。
E-Poet
08-24 10:12:06
AI硬件
Gemini
Pixel 10
分享至
打开微信扫一扫
内容投诉
生成图片
苹果据悉考虑使用Gemini模型来升级Siri 谷歌大涨4%刷新历史新高
8月23日,据知名爆料人马克·古尔曼透露,苹果正与谷歌初步谈判,考虑采用Gemini人工智能模型升级Siri。若达成合作,这将是苹果首次大规模外包核心AI能力。受此消息影响,谷歌股价大涨4%,刷新历史新高,苹果股价也小幅上涨。此前,苹果还曾评估Anthropic和OpenAI的模型,但因财务条件未果。苹果内部Siri升级项目因技术难题推迟一年,现由高管重新接管,并同步开发自研和外采两条技术路线。然而,苹果AI团队动荡加剧,多名核心成员离职,未来方向尚不明朗。
AGI探路者
08-23 03:55:57
Gemini
Siri
苹果
分享至
打开微信扫一扫
内容投诉
生成图片
苹果据悉探索利用谷歌Gemini为新版Siri赋能
8月23日,据财联社报道,苹果正初步探讨利用谷歌Gemini为新版Siri语音助手提供支持。此举或成苹果在人工智能领域外包技术的关键一步。知情人士透露,苹果已与谷歌母公司Alphabet接触,计划开发定制化AI模型,用于明年推出的新版Siri。谷歌也已开始训练可在苹果服务器运行的模型。苹果此前还曾与Anthropic和OpenAI讨论合作可能,评估Claude及ChatGPT的适用性。目前,苹果尚未决定是采用内部模型还是外部技术,潜在合作伙伴仍未确定。苹果与谷歌均拒绝对此置评。
虚拟微光
08-23 02:55:42
Gemini
Siri
苹果
分享至
打开微信扫一扫
内容投诉
生成图片
人工智能模型大促销:谷歌Gemini政府版的年费低至47美分!
8月21日,谷歌宣布推出Gemini政府版(Gemini for Government),以每年47美分的价格向美国联邦政府提供该人工智能模型。这一价格较此前报价优惠71%,并持续至2026年。Gemini政府版仅限谷歌云平台使用,包含Notebook LM AI工具,适用于研究和笔记场景。谷歌强调其安全性和全栈式AI创新方案,符合FedRAMP高标准。此举使谷歌加入OpenAI和Anthropic行列,这些公司均以低价策略加速政府AI采用。目前定价或为吸引政府试用,未来可能通过新付费协议实现盈利。谷歌还整合多项政策要求,提供完全集成的AI就绪平台,进一步巩固其在美国政府云业务中的地位。
智慧轨迹
08-22 12:46:38
人工智能模型
美国联邦政府
谷歌Gemini政府版
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌 Pixel 10 系列手机首发 Gemini 新功能:能在屏幕上圈重点,还会模仿角色说话
谷歌宣布为Gemini Live推出新功能,提升实时对话体验。从下周起,用户共享摄像头画面时,AI助手可在屏幕上突出显示特定物品,如在工具中圈出所需工具。该功能将于8月28日随Pixel 10系列手机首发,并逐步扩展至其他安卓设备。此外,Gemini Live将整合更多应用,如消息、电话和时钟,支持多任务交互,例如中断导航对话发送迟到短信。谷歌还推出新的音频模型,改进语调、节奏和音高表现,支持根据话题调整语气,甚至模仿角色或历史人物口音讲述故事。
像素宇宙
08-21 09:27:13
Gemini Live
Pixel 10
人工智能助手
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序