
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
谷歌搜索推出三大AI革新功能,包括集成Gemini 2.5 Pro模型、Deep Search深度搜索功能以及AI代打电话服务。目前这些功能已在美国上线,未来将推广至全球。AI代打电话功能尤为引人注目,用户只需输入需求,AI会自动匹配商家并拨号预约,甚至谈价砍单。此外,Gemini 2.5 Pro支持复杂查询和推理,Deep Search则可快速生成带引用的深度报告。谷歌搜索负责人Robby Stein表示,这些升级旨在提升用户体验并为商家创造新机会。不过,部分用户担忧AI电话可能带来骚扰问题。此次更新体现了谷歌试图将AI融入日常生活,尤其在本地生活服务领域展现潜力。
原文链接
7月14日,科技媒体9To5Google曝光安卓版谷歌Gemini AI助手正在灰度测试“聊天历史记录搜索”功能。部分用户在使用安卓版Gemini App时,发现汉堡菜单顶部新增“搜索聊天记录”按钮,点击后可进入全屏覆盖的简洁搜索界面,操作逻辑类似ChatGPT。该功能目前尚未进入稳定版或iOS版App,仍需进一步完善。此外,谷歌已将Veo 3AI模型集成到Gemini助手,支持将照片转化为8秒短视频,输出为720p、16:9横屏MP4格式,增添背景音效等功能。
原文链接
7月10日,外媒Testing Catalog曝光谷歌Gemini网页端即将推出新功能:生成插画故事书。通过代码分析发现,谷歌正在开发名为“Storybook”的模块,相关资源已在新版16.26.64.sa.arm64中出现。该功能结合插图与文本,生成适合儿童阅读的图文内容,部分用户已尝试类似工具。目前,上传图片时可看到“Create a Storybook”选项,但功能尚未完善。此前5月,《纽约时报》曾报道,谷歌计划推出的Gemini“儿童版”将具备辅导学习、编故事、完成作业等能力,进一步拓展AI在儿童教育领域的应用。
原文链接
2025年7月,谷歌AI宣传达人Logan Kilpatrick被曝承担了公司90%的营销工作。这位27岁的开发者曾是OpenAI的开发者关系负责人,后被谷歌高管道入,负责推动AI Studio及Gemini系列模型的开发者生态建设。据Business Insider报道,Logan凭借对开发者社区的深刻理解与高效互动,成为谷歌内部的关键人物。他每天在线超8小时,频繁在X平台发布动态并回应开发者需求,甚至被称为“Gemini代言人”。尽管谷歌AI技术领先,但在宣传上仍逊色于OpenAI等竞争对手。此外,Logan还投资了50多家初创公司,活跃于科技领域。近日有传闻称,谷歌Gemini 3.0即将发布,外界期待Logan继续以独特方式助推产品热度。
原文链接
谷歌宣布将在未来几周内将Gemini人工智能助手引入运行Wear OS 4及更新系统的智能手表,涵盖Pixel、三星、OPPO、一加和小米等品牌,全面取代Google Assistant。用户可通过语音指令、侧边按钮或应用图标启动Gemini,支持多种实用场景和跨应用任务,如烹饪建议、日程管理、信息记录等。同时,谷歌升级Circle to Search功能,新增AI深度推理能力,并优化AI概览呈现形式。Pixel 9 Pro用户将免费获得一年Google AI Pro订阅服务,包含Veo 3生成功能,适用于游戏、搜索等多种场景。
原文链接
7月3日,谷歌宣布向159个国家和地区的Gemini用户推出全新Veo 3视频生成模型。该功能目前仅限Google AI Pro计划的付费订阅者使用,每日最多可生成三个视频。谷歌副总裁Josh Woodward透露,公司正研发为Gemini添加图像到视频生成功能,进一步拓展其AI应用能力。这一更新标志着谷歌在AI生成内容领域的持续创新,为用户提供更丰富的多媒体创作工具。
原文链接
2025年7月3日,Gemini模型负责人Ani Baddepudi在谷歌开发者频道揭秘多模态技术。Gemini从设计之初便定位为原生多模态,旨在实现通用人工智能(AGI),尤其强调视觉能力的重要性,因其在医学、金融等领域的广泛应用。通过将文本、图像、视频等统一为token表示,Gemini 2.5在视频理解方面取得显著突破,支持长达6小时的视频处理,并展现强大的泛化能力。团队正努力提升高帧率视频的理解性能,以满足更精细的时间分析需求。此外,Gemini提出“万物皆视觉”理念,目标是让模型感知物理世界并提供专家级辅助。未来方向包括增强交互性及以视觉形式传递信息,使AI更自然友好。
原文链接
Gemini 2.5 Pro模型在AI编程实践中,能够直接读取整个项目,带来全新的体验。长上下文能革新产品交互并开启全新应用场景。谷歌DeepMind的Nikolay Savinov指出,当前百万级token上下文质量尚未完美,盲目追求更大规模意义不大;随着成本下降,千万级token上下文将成为标准...
原文链接
2025年6月30日,谷歌在国际教育技术协会(ISTE)年会上推出多项AI教育工具,其中最引人注目的是专为学校设计的Gemini教育版本,将免费集成到现有Education方案中,供师生使用高级Gemini 2.5 Pro模型。教师可使用‘Gemini in the Classroom’生成词汇表等教学内容,提升效率。同时,NotebookLM新增Video Overviews功能,可快速生成教育视频。部分AI功能如Veo 3音效创作和Gemini in Forms将作为付费服务推出。18岁以上学生可使用Gemini Canvas生成个性化测验题,未来将扩展至更年轻群体。
原文链接
Google于2025年6月27日发布AI编程工具Gemini CLI,该工具主打开源、免费及多任务处理能力,可支持文件管理、内容生成等命令行任务。然而,发布不到20小时便出现登录困难、BUG频发等问题,部分用户指出其存在“套壳”竞争对手Claude Code的争议。尽管如此,Gemini CLI仍展现出强大功能,如部署天气预报应用、整理发票等日常场景。与Cursor等图形化工具不同,Gemini CLI更像一个灵活的AI代理,通过自然语言指令完成多种任务,为非程序员用户提供低门槛的AI协作体验。
原文链接
加载更多

暂无内容