
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,Nano Banana因其创新的AI图像生成技术引发热议。这款工具通过自然语言对话,让用户能快速生成和编辑高质量图像,吸引了大量非技术用户。其流畅的交互体验和几秒内的生成速度,带动Gemini App短时间内新增超1000万用户。Nano Banana优化了创作流程,支持角色一致性、多图融合及世界知识推理,被比作ChatGPT发布时刻。尽管官方未披露底层架构,但技术社区猜测其采用多模态扩散Transformer或结合大语言模型的设计。尽管在长文本渲染和复杂细节上仍有不足,Nano Banana标志着图像生成进入新阶段。
原文链接
标题:上海AI Lab庞江淼:开放平台是具身智能“ChatGPT时刻”的前提
正文:
在上海AI实验室,青年科学家庞江淼正带领具身智能团队探索机器人领域的未来。作为计算机视觉(CV)出身的科研者,他曾连续斩获MS COCO目标检测挑战赛冠军,并主导开发了多个开源平台。然而,他并未局限于感知层面,...
原文链接
视频生成的“ChatGPT时刻”尚未到来,尽管Sora等产品展示了生成长视频的潜力,但目前的视频生成技术仍处于初级阶段,距离大众化应用还有一定距离。Sora在生成长度可达1分钟的视频,远超其他竞品,但其所有发布内容仅限于演示,并未全面开放给公众体验。Shy Kids的后期制作成员Patrick Ce...
原文链接
加载更多

暂无内容