综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月26日,Black Forest Labs发布新一代图像生成模型FLUX.2,专为实际创意工作流程设计。该模型可同时参考最多10张图像,支持高精度细节和照片级真实感,文本渲染更成熟,能准确遵循用户提示,对现实世界的理解显著提升,并支持4MP图像编辑。FLUX.2系列包含多种版本,部分以开放权重形式提供,为创作者提供更多灵活性。这一发布标志着AI图像生成技术在实用性和性能上的进一步突破。
原文链接
北京时间11月21日,谷歌发布Nano Banana Pro图像生成模型,基于Gemini 3 Pro打造。新模型在细节表现、分辨率、文本渲染及多语言支持上显著提升,并新增编辑功能与互联网搜索能力,可生成清晰文字、调整图像角度和焦点,最高支持4K分辨率。Nano Banana Pro适合制作PPT、信息图表等,最多处理14张图像或5个角色,保持一致性。该工具已在Gemini应用上线,免费用户可试用但有配额限制,订阅用户享有更高权限,未来将率先向Ultra用户开放Flow工具中的功能。
原文链接
10月14日,微软发布自研AI文生图模型MAI-Image-1。该模型以生成逼真的图像著称,尤其擅长闪电、风景等场景,同时具备快速处理请求的能力,较“更大、更慢的模型”更具效率。目前,MAI-Image-1已在人工智能基准网站LMArena的同类模型中位列前十,展现出卓越性能。这一发布进一步巩固了微软在AI图像生成领域的竞争力。
原文链接
10月7日,谷歌宣布其图像生成AI模型Nano Banana(Gemini 2.5 Flash Image)正式开放商用,并新增批量处理和自定义长宽比功能。该模型自8月底预览以来已创作超50亿个作品,现可通过Gemini App、Google AI Studio等平台访问。正式版支持10种长宽比,包括电影比例、社交媒体配图等,满足多样化需求。模型适用于生产环境,受商业条款保护,收费为每百万Token 30美元,单张图片生成成本约0.039美元(约合0.28元人民币)。
原文链接
9月9日晚间,腾讯混元发布最新生图模型“混元图像2.1(HunyuanImage 2.1)”,支持最长1000个tokens提示词及原生2K图像生成。同时透露,其原生多模态图像生成模型正在开发中。此外,腾讯混元开源中英文改写模型“混元文本改写模型(PromptEnhancer)”,可优化用户文本指令结构。
原文链接
8月26日,谷歌发布其最新图像生成与编辑模型Gemini 2.5 Flash Image(代号“纳米香蕉”)。该模型在LMArena基准测试中排名AI图像编辑模型榜首,支持角色一致性保持、自然语言修图及多图融合,并借助Gemini世界知识提升智能表现。用户可通过Gemini App或API访问,API定价为每百万输出token 30美元。据官方估算,生成单张图片约消耗1290个输出token,成本约为0.039美元。这一工具的推出为图像创作和编辑领域带来全新可能性。
原文链接
加载更多
暂无内容