综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
据IT之家11月3日消息,彭博社Mark Gurman爆料称,苹果计划明年3月推出升级版Siri,该版本将基于谷歌Gemini定制AI模型运行,并新增AI驱动的网络搜索功能。报道称,苹果为此向谷歌支付费用,定制模型将在苹果私有云服务器上运行,但Siri不会直接包含谷歌服务或Gemini功能,而是通过苹果用户界面提供优化体验。Gurman提醒,新Siri能否被用户接受及改善品牌形象仍存不确定性。此外,苹果预计在明年6月的全球开发者大会上预览iOS 27、macOS 27等系统更新,重点聚焦Apple Intelligence及整体AI战略。
原文链接
4月5日,谷歌公布了Gemini 2.5 Pro API的定价,最高每百万输入tokens收费1.25美元起步。超过20万tokens后,费用升至每百万输入tokens2.50美元,而输出tokens费用更高。此定价高于谷歌现有及部分竞争对手的AI模型,如OpenAI的o3-mini和DeepSeek的R1。尽管如此,Gemini 2.5 Pro在速率限制下可免费使用。谷歌CEO桑达尔·皮查伊透露,该模型本月在谷歌AI Studio和Gemini API上的使用量增长达80%,成为最受欢迎的AI模型之一。顶级AI模型的价格普遍呈上涨趋势,如OpenAI最新推出的o1-pro定价高昂,每百万输入tokens达150美元。
原文链接
Meta于7月2日发布了一项突破性研究,推出了Meta 3D Gen AI模型,可在一分钟内根据用户输入的提示生成高质量3D内容。这款AI模型创造出的3D资产具有高分辨率纹理和物理渲染效果,且支持对已有内容进行纹理重生成。Meta 3D Gen由text-to-3D生成和text-to-texture生成两部分组成,第一阶段生成基础3D模型约30秒,第二阶段则进一步细化纹理或从头开始生成,每项操作约需20秒。这一技术革新展示了Meta在人工智能驱动的3D创作领域的最新进展。
原文链接
谷歌于6月28日发布开源AI模型Gemma 2,提供90亿和270亿参数版本,性能超越同级,单A100/H100 GPU即可运行,降低部署成本。27B版本表现出色,甚至胜过两倍规模的主流模型;9B版本优于Llama 3 8B。Gemma 2-27B在单GPU上高效运行,支持跨硬件快速推理,适应不同硬件环境。未来还将推出26亿参数版本,适用于手机AI应用。这一最新进展展示了谷歌在AI领域的技术实力与成本优化策略。
原文链接
谷歌DeepMind近期发布新研究,开发出"video-to-audio" AI技术,可为无声视频自动生成背景音乐。目前模型需用户输入提示词引导,如指定场景和音效类型,能生成无限量协调音轨并判断音频情感倾向。团队目标是未来实现无提示词自动配音及提升角色对话口型同步,持续优化中。这一创新发生于6月18日,展示了AI在多媒体创作领域的最新进展。
原文链接
加载更多
暂无内容