
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,Nano Banana因其创新的AI图像生成技术引发热议。这款工具通过自然语言对话,让用户能快速生成和编辑高质量图像,吸引了大量非技术用户。其流畅的交互体验和几秒内的生成速度,带动Gemini App短时间内新增超1000万用户。Nano Banana优化了创作流程,支持角色一致性、多图融合及世界知识推理,被比作ChatGPT发布时刻。尽管官方未披露底层架构,但技术社区猜测其采用多模态扩散Transformer或结合大语言模型的设计。尽管在长文本渲染和复杂细节上仍有不足,Nano Banana标志着图像生成进入新阶段。
原文链接
9月5日,谷歌AI实验项目“Nano Banana”爆火,Gemini上线Gemini 2.5 Flash Image功能。谷歌实验室副总裁Josh Woodward透露,该功能已实现超2亿次图像编辑,吸引超1000万新用户。Nano Banana因避免“恐怖谷效应”、保持人物特征一致性而广受好评,其表现优于GPT-4o等竞品。目前,Gemini免费用户每日可编辑100次图像,付费用户可扩展至1000次。分析师认为,谷歌通过高质量工具吸引用户并引入Gemini生态的策略初见成效,展现了实际应用价值。
原文链接
8月25日,Meta首席人工智能官Alexandr Wang在Threads上宣布,Meta将与Midjourney合作开发图像和视频生成技术。此次合作将结合Meta的研究团队与Midjourney的专业技术,推动AI模型和产品的创新应用。这一消息展示了AI领域在多媒体内容生成方面的新动向,为未来的技术发展带来新期待。
原文链接
2025年8月,一款名为UnMarker的开源工具引发关注,它能在5分钟内去除几乎所有AI图像水印,包括谷歌HiDDeN和SynthID等主流技术。UnMarker通过修改图像频谱幅度而非像素值,实现高效去水印,同时保持较高图像质量。实验显示,该工具对多种水印移除率高达57%-100%,但可能轻微影响图像细节。其支持消费级显卡部署,大幅降低使用门槛。这一技术让被视为对抗AI造假重要手段的水印技术面临挑战。微软近期研究也表明,人类识别AI生成图像的准确率仅为62%,凸显了水印技术的重要性。然而,UnMarker的出现或使现有法规和技术手段需重新评估。
原文链接
7月19日,以隐私保护著称的浏览器DuckDuckGo推出新功能,允许用户过滤搜索结果中的AI生成图像。该功能因用户反馈AI图片干扰正常搜索而开发。在“图片”标签下,新增“AI图像”下拉菜单,用户可选择“显示”或“隐藏”AI生成内容。此外,通过搜索设置也可启用过滤器。DuckDuckGo表示,该功能基于开源屏蔽列表(如uBlockOrigin和uBlacklist),虽无法完全拦截所有AI图像,但能显著减少相关内容。未来还将推出更多过滤选项,具体细节尚未公布。
原文链接
6月17日,Adobe宣布推出独立应用“Adobe Firefly”,支持安卓和iOS平台。这款应用提供生成式填充、扩展、文本生成图像/视频等功能,可移除照片干扰元素或添加新内容,还支持将图片延展以适应不同画幅,适合社交媒体创作。生成视频时长为5秒,支持OpenAI或谷歌模型的选择。Firefly基于去年10月发布的Adobe Firefly模型,此前部分功能已集成于Photoshop等软件中。应用默认使用Adobe自研模型,新用户可免费下载,但高级功能需购买积分,价格为每月4.99美元或每年49.99美元。目前仅支持英语、法语、德语和日语。
原文链接
5月16日,《科创板日报》报道,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0),该模型已上线官网并开放注册。相比前代,混元图像2.0参数量提升十倍,实现毫秒级响应,支持实时语音或文字生成图片。测试显示,其在人物、动物特写及复古摄影领域表现优秀,生成图片质量接近电影级别。此次发布标志着腾讯重构混元大模型研发体系后的首个重要进展。两周前,腾讯成立大语言模型部和多模态模型部,加速AI技术研发。腾讯董事会主席马化腾表示,AI已对广告与游戏业务产生实际贡献,未来将进一步拓展AI应用场景,提升用户留存与活跃度。尽管AI整合仍在初期,但用户互动量正逐步增长。
原文链接
近日,华中科技大学盛建中团队研发的AI图像生成系统助力警方找回19名失踪儿童。该系统通过AI技术预测失踪儿童不同年龄段的样貌,解决模糊照片难题,团队还构建了40万人脸数据库并自研算法,修复千张走失儿童照片。此系统结合社会多方力量,推动寻亲进程。截至目前,已有包括孙卓在内的多名失踪多年的儿童与家人团聚。这项技术的应用展现了科技在社会公益领域的创新价值。
原文链接
4月30日,英伟达推出了一款新工具Nvidia AI Blueprint for 3D-guided generative AI,允许开发者基于3D场景生成AI图像。该工具支持Blender的3D建模软件与Black Forest Lab的FLUX.1图像生成器协作,需配备RTX 4080或更高型号GPU才能运行。用户可通过Blender创建3D场景并调整细节,再由FLUX.1生成更具体的2D图像,提供比纯文本描述更高的细节控制。英伟达称其为“预定义、可定制的AI工作流程”,并附带文档与示例资源。值得注意的是,Adobe曾在去年10月提及类似工具“Project Concept”,但目前仍处于实验阶段。此工具的推出标志着生成式AI应用领域的进一步发展。
原文链接
4月30日,Freepik联合Fal.ai推出开源AI图像模型F Lite,基于内部8000万张商业许可及安全内容数据集训练,解决了版权法律风险问题。该模型参数达10B,提供标准版和纹理版两种选择,前者适合通用图像生成,后者强调纹理细节但可能产生畸形且不适于矢量风格。运行F Lite需至少24GB VRAM显卡,推荐使用详细提示词提升效果。Freepik还兼容ComfyUI工具并支持SuperPrompt功能扩展。模型采用CreativeML Open RAIL-M许可发布,核心组件T5 XXL和Flux Schnell VAE遵循Apache 2.0许可,大幅提高开放性和灵活性。
原文链接
加载更多

暂无内容