成本降低 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek-V3.2-Exp API价格官宣大幅下调

9月29日，DeepSeek宣布其官方App、网页端及小程序已同步更新至DeepSeek-V3.2-Exp版本。由于新模型服务成本显著降低，官方API价格即刻起大幅下调，开发者调用API的成本将减少50%以上。这一调整为开发者提供了更经济高效的接入方案，进一步推动技术应用的普及与创新。

原文链接

数据炼金师

09-29 19:17:29

API价格下调

DeepSeek-V3.2-Exp

服务成本降低

分享至

打开微信扫一扫

内容投诉

生成图片

超谷歌搜索：阿里开源创新大模型搜索引擎 ZeroSearch，成本直降 80% 且能力更强

5月9日，阿里巴巴在GitHub等平台开源了创新大模型搜索引擎ZeroSearch。该框架无需与真实搜索引擎交互，即可提升大模型的搜索能力。ZeroSearch通过利用大模型预训练的知识，生成相关内容并动态控制质量。在多个问答数据集测试中，70亿参数模型达到33.06分，140亿参数模型达33.97分，超越谷歌搜索的32.47分。此外，使用ZeroSearch的成本大幅降低，例如在四个A100 GPU上的模拟训练仅需70.80美元，较谷歌搜索的传统训练方式成本减少87.93%以上。ZeroSearch的论文和开源代码已同步发布，有望推动大模型搜索技术的发展。

原文链接

量子思考者

05-09 08:45:27

成本降低

搜索引擎

阿里

分享至

打开微信扫一扫

内容投诉

生成图片

百度端到端语音语言大模型发布，成本宣称最高降 90%

3月31日，百度AI DAY上发布首个基于全新互相关注意力（Cross-Attention）的端到端语音语言大模型，该模型在电话语音问答场景中的调用成本较行业均值下降50%-90%，大幅降低使用成本。文小言同步完成品牌焕新，接入该模型后支持更拟真语聊效果及重庆、广东、山东等多种方言。此外，文小言新增“多模型融合调度”功能，整合百度文心X1、文心4.5等自研模型及第三方DeepSeek-R1模型，提供智能协同服务。用户可选择自动模式调用最优组合或单模型完成特定任务，显著提升响应效率。文小言还强化图片问答功能，支持数学题解题思路生成及商品参数对比等实用场景。新增“图个冷知识”功能可从多维度解读图片内容，例如对猫窗行为的科学分析。百度语音首席架构师贾磊表示，该模型不仅大幅降低成本，还使语音交互等待时间降至1秒左右，交互流畅性大幅提升。

原文链接

超频思维站

03-31 17:43:30

成本降低

百度

语音语言大模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI开放满血o1模型API 成本暴降60%

12月18日，OpenAI在技术分享直播中发布了全面升级的o1模型API，并支持WebRTC。此次更新使o1模型的API成本降低了60%，并新增了高级视觉功能。此外，GPT-4o的音频处理成本同样减少了60%，而其mini版本的价格更是大幅下降了10倍。OpenAI还推出了一种新的偏好微调方法，即直接偏好优化算法，以更好地理解和适应用户偏好。此次更新标志着OpenAI在提高效率和降低成本方面取得了显著进展。

原文链接

E-Poet

12-18 08:27:06

API

OpenAI

成本降低

分享至

打开微信扫一扫

内容投诉

生成图片

成本降低1000倍！微软将开源超强RAG— LazyGraphRAG

正文：微软近日发布了LazyGraphRAG，这是GraphRAG的迭代版本，开源后仅四个月便在GitHub获得超过19000颗星，成为当前最热门的RAG框架之一。LazyGraphRAG显著降低了数据索引成本，仅为GraphRAG的0.1%，即成本降低了1000倍。该框架采用全新的混合数据搜索方法...

原文链接

Journeyman

11-27 11:50:19

LazyGraphRAG

开源

成本降低

分享至

打开微信扫一扫

内容投诉

生成图片

制作成本降低97.5%！“清华版Sora”视频模型Vidu全球首发主体参照技术

### "清华版Sora"Vidu视频模型全球首发，成本降低97.5% 在11日举行的生数科技媒体开放日上，由生数科技与清华大学联合研发的国内首个纯自研原创视频大模型Vidu，宣布了全球首个“主体参照”技术的更新。该技术允许Vidu生成任意主体的一致性视频，无论是人物、动物、商品还是虚拟角色，均能...

原文链接

智慧棱镜

09-12 10:45:28

主体参照技术

成本降低97.5%

视频模型Vidu

分享至

打开微信扫一扫

内容投诉

生成图片

成本降低90%！Claude上新Gemini同款提示词缓存，一次性记住整个代码库

Claude最新推出了API长文本缓存功能，将成本降低了90%，使得一次性记住整个代码库成为可能。这一功能借鉴了谷歌Gemini的同款提示词缓存，并得到了国内团队Kimi和DeepSeek的跟进。通过缓存，用户可以在后续请求中直接复用内容，大幅减少处理长文本的延迟时间和成本。Claude的官方文档列举了几个应用场景，如对话、代码助理、大型文档处理等，均显示出了显著的速度提升和成本节约。对于开发者而言，这项更新意味着能够更高效地利用AI资源，比如一次向模型提供整个代码库，要求增加新功能，或是直接输入大量文档而不必重复输入。尽管不同平台在实现细节上有所差异，但这种模式已经受到顶级玩家的青睐，预计将成为大模型厂商的标准配置。

原文链接

GhostPilot

08-16 06:31:02

Claude新功能

Gemini同款提示词缓存

成本降低90%

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI开战小模型，GPT-4o mini成本再降60%

OpenAI于7月19日推出全新小模型GPT-4o mini，宣称是最智能且实惠的选择，其API价格较GPT-3.5 Turbo降低至少60%。GPT-4o mini支持128K输入和16K输出，性能超越同类轻量级模型，且基于强大的GPT-4o旗舰模型优化，可处理多种模态。这款模型将逐步向公众开放，包括免费用户、Plus订阅者和企业用户。OpenAI强调了在保持性能提升的同时降低成本，预示着“小模型”时代将助力AI应用更广泛部署。国内API价格战与海外技术发展同步，智能硬件成为大模型落地的重要领域，未来通用大模型公司将面临智能提升与模型小型化的双重挑战。

原文链接