综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,DeepMind CTO Koray Kavukcuoglu在访谈中揭示了Google过去两年如何从落后到追赶的转变。他坦言,两年前Google在大模型领域远远落后,关键转折在于承认问题并重新构建训练、产品和工程方式。Gemini 3的成功得益于用户界面优化、任务链路稳定及真实数据反馈,使模型更贴近用户需求。此外,Google将安全融入训练过程,并通过统一多模态模型提升对复杂场景的理解能力。Koray强调,未来模型发展仍充满不确定性,但Google正通过基础设施优势与跨部门协作,推动深层推理和多步执行能力的发展。这标志着Google从科研向工程与产品的全面转型。
原文链接
2017年,Google Brain团队发表Transformer论文,奠定了AI革命基础,催生了OpenAI的ChatGPT等技术。然而,Google面临创新者困境:尽管拥有强大资源如Gemini模型、TPU芯片和500亿美元年收入的云服务,却因变现难题和人才流失(如Ilya Sutskever、Dario Amodei等出走)而陷入竞争劣势。2022年底,ChatGPT发布后迅速达到1亿用户,对Google构成存在威胁,迫使其推出Bard但表现不佳。2023年起,Google通过整合DeepMind与Brain团队、加速Gemini研发应对挑战,但仍需解决搜索广告业务与AI转型的冲突。未来几年,Google能否成功平衡保护现金牛与拥抱AI时代,将成商业史经典案例。
原文链接
11月2日,搜索引擎巨头Google确认将在其AI搜索功能中引入广告。尽管AI技术正在改变搜索体验,但Google强调其广告业务不会缺席,而是以更适应AI生态的方式呈现。目前,Google已推出AI概览和AI模式,并计划整合Gmail、Drive等服务,打造个性化AI体验。Google的Robby Stein表示,广告将融入用户场景,例如通过拍摄鞋子照片获取类似鞋款推荐,或根据复杂需求推荐餐厅。这种模式旨在提供更具帮助性的服务。据悉,Google已在有限范围内测试AI搜索广告,预计明年公布详细计划。
原文链接
10月25日,谷歌推出数字学习平台“Google Skills”,集成约3000门课程、实验与职业认证,涵盖生成式AI、编程、网络安全等领域,旨在培养数字时代必备技能。平台内容来自Cloud、DeepMind等谷歌资源,适合不同背景学习者,并采用游戏化设计,95%用户更青睐此形式。谷歌数据显示,2024年已有超2600万人通过其学习资源完成课程或认证。基础课程免费开放,但进阶实验与职业认证需付费。教育机构等可通过“Career Launchpad”项目获取免费培训。
原文链接
10月13日,OpenAI的AI视频生成应用Sora即将登陆安卓平台,目前该应用已以不可用状态现身Google Play,并开放预注册。与iOS版本类似,安卓版现阶段仅面向北美地区的美国和加拿大用户。这一动态展示了Sora在多平台扩展的最新进展,预计将在未来进一步扩大覆盖范围。
原文链接
9月17日消息,微软正为Copilot引入完整“记忆管理”功能,并计划新增Google Drive连接器。新版Copilot将允许用户在个人资料页启用记忆功能,未来可增删改AI已存记忆,提升交互延续性与定制性。目前测试版已上线“管理记忆”开关,但仅支持按指令记忆和一次性删除全部记忆。微软还计划推出类似ChatGPT的独立记忆管理页面。此外,Copilot目前已支持OneDrive连接,未来将扩展至Google Drive,允许AI读取、总结文件内容并用于深度研究。部分高级功能可能需订阅每月20美元的服务。
原文链接
2025年9月,Google Gemini凭借Nano Banana图像编辑功能登顶App Store免费榜,击败ChatGPT。Gemini作为通用AI助手,整合多种强大功能,包括Canvas画布、Veo3视频生成等,并提供2.5 Pro和Flash两种模型。此外,Google推出完整AI工具全家桶,涵盖NotebookLM知识库、Flow高质量视频生成、AI Mode增强搜索、Gemini CLI本地助手等。NotebookLM可将上传的文件转化为笔记、思维导图或测验;Flow支持竖屏高清视频生成,适合短视频平台;AI Mode则提升搜索推理能力,但暂不支持中文。这一系列工具展现了Google在AI领域的全面布局,旨在无缝融入用户的学习与工作场景,提升生产力。
原文链接
2025年8月,谷歌DeepMind团队在最新开发者节目中展示了Gemini 2.5 Flash Image模型,该模型具备原生图像生成与编辑能力,支持多轮对话式场景一致性操作,堪称图像生成领域的革命性突破。其亮点包括创意解读模糊指令、文本渲染改进及复杂任务的交错生成机制,适用于家居设计、人物OOTD等场景。团队核心成员包括Logan Kilpatrick、Kaushik Shivakumar、Robert Riachi、Nicole Brichtova和Mostafa Dehghani,他们在AI、多模态学习等领域有深厚积累。相比专注文本到图像的Imagen,Gemini更适合复杂多模态任务,未来目标是迈向通用人工智能(AGI)。
原文链接
2025年8月,OpenAI面临是否走向Google商业化模式的讨论。GPT-5被提出可通过识别高价值问题并完成交易分成实现变现,但与Google的CPC模式相比,其CPA模式受限于转化率和颗粒度问题。分析指出,ChatGPT可能更适合AI原生的商业模式,例如利用Agent异步性为任务时间价值定价或激励广告主提供丰富内容降低成本。此外,本周市场数据显示,对冲基金减仓科技股,防御性配置增加,亚洲市场表现突出。同时,Google升级AI Mode功能,Elon Musk成立‘Macrohard’挑战微软,Meta与谷歌达成百亿美元云计算协议,显示AI领域的竞争与合作加剧。
原文链接
8月13日,Google I/O Connect China 2025开发者大会在上海举办。大会聚焦AI技术创新、开发工具升级及全球化生态支持,助力中国出海开发者加速创新与业务增长。Google大中华区及韩国总裁陈俊廷强调,中国开发者在全球创新中表现卓越,12家团队斩获Google Play年度大奖。Gemini 2.5等AI模型赋能开发者突破边界,Gemma开放模型系列拓展医疗健康、端侧设备等领域应用。此外,AI驱动的Firebase Studio、Android Studio等工具革新开发流程,显著提升效率。Google还推出“Google Developer Program”和第四期“出海加速器”,为中国开发者提供专属资源与成长支持,推动中国创新走向全球。
原文链接
加载更多
暂无内容