综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,OpenAI发布GPT-5.2,迅速反超谷歌Gemini 3 Pro,强化多项实用能力。新版在表格制作、PPT设计、代码编写、长文档理解等领域表现显著提升,视觉理解与工具调用能力也大幅增强。测试显示,GPT-5.2 Pro在ARC-AGI评测中得分90.5%,成本仅为11.64美元,效率较一年前提升390倍。其代码能力刷新纪录,在SWE-bench Verified上达80%准确率,长上下文处理接近100%准确率。此外,模型在科学辅助领域表现出色,GPQA Diamond评测得分93.2%。核心团队包括多位北大数院校友及数学专业背景的研究者,如Yu Bai、Yaodong Yu等,多为2024年后加入OpenAI的新成员。
原文链接
11月28日,因用户需求激增,谷歌对Gemini 3 Pro和Nano Banana Pro的免费用户使用权限作出进一步限制。目前,免费用户每日仅可发送5次提示词,较之前未变,但图像生成与编辑权限从每日3张收紧至2张,并可能频繁调整。此外,NotebookLM平台临时回调了由Nano Banana Pro驱动的‘信息图’与‘幻灯片套组’功能,免费用户已无法使用,Pro订阅用户也受到额外限制。谷歌解释称,由于需求远超预期,正面临容量压力,但计划尽快恢复服务。此次调整不影响Google AI Pro或Ultra订阅用户。
原文链接
11月26日,Opera更新其AI浏览器Neon,新增“1分钟深度研究”模式,通过调动多个AI线程并行处理复杂问题,提供比标准查询更深入的分析结果。新版本集成谷歌Gemini 3 Pro和Nano Banana Pro大语言模型,用户可在对话中随时切换模型以适配不同任务需求。此外,Neon还支持与Google Docs无缝协作,用户可通过自然语言指令创建或编辑文档,并实现内容自动化优化。该浏览器采用订阅模式,月费19.99美元,用户可申请加入等候名单体验新功能。
原文链接
11月19日,谷歌发布旗舰版Gemini 3 Pro模型,主打编码、推理能力提升,并减少“谄媚”式回复。新模型支持文本、图像、音频多模态处理,可翻译菜谱照片、生成交互学习卡片,还能优化搜索结果呈现方式。谷歌DeepMind负责人Tulsee Doshi称其为“人人皆可获取且使用”的信息工具。Gemini 3 Pro还具备智能代理功能,如整理邮件、预订旅行等,展现出强大的任务规划能力。同时,谷歌推出开发工具Antigravity,支持多智能体协作,提供任务报告和反馈机制,旨在构建AI生态闭环。官方跑分显示,Gemini 3 Pro在21项基准测试中表现优异,尤其在知识生成和AI工具使用方面领先。谷歌此次布局不仅限于模型升级,更瞄准了未来沉浸式交互与多模态AI应用的广阔前景。
原文链接
2025年11月21日,谷歌推出Nano Banana Pro(Gemini 3 Pro Image)升级版文生图模型,迅速引发全网热议。该模型整合Gemini 3 Pro的多模态理解能力与谷歌搜索知识库,支持2K、4K分辨率、多语言渲染及复杂图表生成。硅谷VC大佬Deedy实测显示,其可快速将财报PDF转为精美图表,或将Graphviz代码生成可视化效果图。普通用户可在Gemini应用中免费体验,但有额度限制。实测中,Nano Banana Pro成功生成自行车爆炸视图和玩偶看电视场景,完成度高且细节丰富。网友测试进一步验证其强大功能,如制作杂志排版、条漫、世界杯海报等。谷歌CEO皮猜称赞其擅长复杂图表生成,具备高级世界知识与文本渲染能力,掀起AI生图热潮。
原文链接
2025年11月,谷歌推出Nano Banana Pro,集成Gemini 3与Veo 3能力,大幅提升AI图像生成技术。新模型支持多模态理解、14张图片混合输入及多语言文本渲染,可直接翻译图片中的文字并保持设计风格。其深度整合Google Search知识库,能生成基于实时信息的精准图表和信息图,如食谱、生态图解等。此外,Nano Banana Pro支持2K、4K分辨率及多种宽高比,适合专业制作需求,并可通过调整光线、色彩等优化图像效果。工作流整合Veo 3视频生成模型,实现从图像到视频的一键生成。谷歌通过Gemini应用、API及第三方工具(如Photoshop、Figma)全面铺开服务,同时推出AI图像验证功能,依托SynthID数字水印技术识别AI生成内容,并嵌入C2PA元数据追踪来源。
原文链接
11月20日,谷歌发布全新图像生成模型Nano Banana Pro,基于Gemini 3 Pro架构打造,支持4K分辨率与精准文字渲染。该模型可生成高质量设计作品,具备复杂信息图表处理能力,适合制作多语言海报等。新增高级编辑功能,包括局部编辑、背景虚化、色彩分级等,并支持C2PA元数据嵌入,便于识别AI生成内容。生成速度较前代下降,成本上升,4K图像单张费用约1.7元人民币。免费用户可试用有限功能,订阅Google AI Plus/Pro/Ultra服务可获更高配额。模型正逐步集成至Gemini应用、Google Workspace及视频工具Flow等主流平台,同时开放API供开发者使用。
原文链接
11月20日,谷歌正式上线Gemini 3 Pro Image Preview图像模型,疑为Nano Banana Pro。该模型专为复杂和多轮图像生成及编辑设计,融合先进推理功能,可显著提升图像质量、渲染多语言长文本,并支持高达4K分辨率输出。此外,新增基于搜索的接地功能,确保生成内容更准确且信息更及时。Gemini 3 Pro被称为谷歌功能最强大、用途最广泛的图像生成模型,现已在Vertex AI平台上线,并可通过Google AI Studio使用Gen AI SDK调用。这一发布为创意工作流提供了更高效的解决方案。
原文链接
2025年11月20日,谷歌发布物理世界最强AI模型Gemini 3 Pro预览版,API同步开放。该模型在主要Arena排行榜中几乎全排名第一,性能断层领先,尤其在推理、多模态和Agent工具使用等关键基准上霸榜。其在Humanity's Last Exam测试中得分高达41.0%,数学竞赛AIM...
原文链接
谷歌Gemini 3 Pro发布仅一天,网友已玩出多种创意应用。通过简单对话或上传图片,AI可生成复古滤镜的“数字拍立得”、复刻经典小游戏如吃豆人和迷宫游戏,甚至实现乐高自由与3D体素世界。此外,单次指令即可生成2D跑酷游戏、水物理测试场景及手机应用UI界面等。部分用户利用草稿图直接转化为可交互网站或房屋布局设计工具,展现极强适应性。该模型还支持实时提示录屏、视频比例调整等功能,为内容创作提供便利。参考链接显示案例来自11月19日社交平台分享,体现时效性与新鲜性。
原文链接
加载更多
暂无内容