1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强
5月9日,阿里巴巴在GitHub等平台开源了创新大模型搜索引擎ZeroSearch。该框架无需与真实搜索引擎交互,即可提升大模型的搜索能力。ZeroSearch通过利用大模型预训练的知识,生成相关内容并动态控制质量。在多个问答数据集测试中,70亿参数模型达到33.06分,140亿参数模型达33.97分,超越谷歌搜索的32.47分。此外,使用ZeroSearch的成本大幅降低,例如在四个A100 GPU上的模拟训练仅需70.80美元,较谷歌搜索的传统训练方式成本减少87.93%以上。ZeroSearch的论文和开源代码已同步发布,有望推动大模型搜索技术的发展。
量子思考者
05-09 08:45:27
成本降低
搜索引擎
阿里
分享至
打开微信扫一扫
内容投诉
生成图片
百度端到端语音语言大模型发布,成本宣称最高降 90%
3月31日,百度AI DAY上发布首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,该模型在电话语音问答场景中的调用成本较行业均值下降50%-90%,大幅降低使用成本。文小言同步完成品牌焕新,接入该模型后支持更拟真语聊效果及重庆、广东、山东等多种方言。此外,文小言新增“多模型融合调度”功能,整合百度文心X1、文心4.5等自研模型及第三方DeepSeek-R1模型,提供智能协同服务。用户可选择自动模式调用最优组合或单模型完成特定任务,显著提升响应效率。文小言还强化图片问答功能,支持数学题解题思路生成及商品参数对比等实用场景。新增“图个冷知识”功能可从多维度解读图片内容,例如对猫窗行为的科学分析。百度语音首席架构师贾磊表示,该模型不仅大幅降低成本,还使语音交互等待时间降至1秒左右,交互流畅性大幅提升。
超频思维站
03-31 17:43:30
成本降低
百度
语音语言大模型
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI开放满血o1模型API 成本暴降60%
12月18日,OpenAI在技术分享直播中发布了全面升级的o1模型API,并支持WebRTC。此次更新使o1模型的API成本降低了60%,并新增了高级视觉功能。此外,GPT-4o的音频处理成本同样减少了60%,而其mini版本的价格更是大幅下降了10倍。OpenAI还推出了一种新的偏好微调方法,即直接偏好优化算法,以更好地理解和适应用户偏好。此次更新标志着OpenAI在提高效率和降低成本方面取得了显著进展。
E-Poet
12-18 08:27:06
API
OpenAI
成本降低
分享至
打开微信扫一扫
内容投诉
生成图片
成本降低1000倍!微软将开源超强RAG— LazyGraphRAG
正文:微软近日发布了LazyGraphRAG,这是GraphRAG的迭代版本,开源后仅四个月便在GitHub获得超过19000颗星,成为当前最热门的RAG框架之一。LazyGraphRAG显著降低了数据索引成本,仅为GraphRAG的0.1%,即成本降低了1000倍。该框架采用全新的混合数据搜索方法...
Journeyman
11-27 11:50:19
LazyGraphRAG
开源
成本降低
分享至
打开微信扫一扫
内容投诉
生成图片
制作成本降低97.5%!“清华版Sora”视频模型Vidu全球首发主体参照技术
### "清华版Sora"Vidu视频模型全球首发,成本降低97.5% 在11日举行的生数科技媒体开放日上,由生数科技与清华大学联合研发的国内首个纯自研原创视频大模型Vidu,宣布了全球首个“主体参照”技术的更新。该技术允许Vidu生成任意主体的一致性视频,无论是人物、动物、商品还是虚拟角色,均能...
智慧棱镜
09-12 10:45:28
主体参照技术
成本降低97.5%
视频模型Vidu
分享至
打开微信扫一扫
内容投诉
生成图片
成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库
Claude最新推出了API长文本缓存功能,将成本降低了90%,使得一次性记住整个代码库成为可能。这一功能借鉴了谷歌Gemini的同款提示词缓存,并得到了国内团队Kimi和DeepSeek的跟进。通过缓存,用户可以在后续请求中直接复用内容,大幅减少处理长文本的延迟时间和成本。Claude的官方文档列举了几个应用场景,如对话、代码助理、大型文档处理等,均显示出了显著的速度提升和成本节约。对于开发者而言,这项更新意味着能够更高效地利用AI资源,比如一次向模型提供整个代码库,要求增加新功能,或是直接输入大量文档而不必重复输入。尽管不同平台在实现细节上有所差异,但这种模式已经受到顶级玩家的青睐,预计将成为大模型厂商的标准配置。
GhostPilot
08-16 06:31:02
Claude新功能
Gemini同款提示词缓存
成本降低90%
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI开战小模型,GPT-4o mini成本再降60%
OpenAI于7月19日推出全新小模型GPT-4o mini,宣称是最智能且实惠的选择,其API价格较GPT-3.5 Turbo降低至少60%。GPT-4o mini支持128K输入和16K输出,性能超越同类轻量级模型,且基于强大的GPT-4o旗舰模型优化,可处理多种模态。这款模型将逐步向公众开放,包括免费用户、Plus订阅者和企业用户。OpenAI强调了在保持性能提升的同时降低成本,预示着“小模型”时代将助力AI应用更广泛部署。国内API价格战与海外技术发展同步,智能硬件成为大模型落地的重要领域,未来通用大模型公司将面临智能提升与模型小型化的双重挑战。
智能维度跳跃
07-19 20:41:17
GPT-4o mini
小模型
成本降低
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面发布“上下文缓存”技术 称最高可降本90%
月之暗面科技有限公司于2日发布全新上下文缓存技术(ContextCaching),应用于其大模型Kimi的开放平台公测。该技术旨在显著降低开发者在使用长文本旗舰模型时的成本,最高可节省90%费用,为行业带来了显著的成本效益革新。这一创新举措提升了效率,标志着实时性强的技术发展动态。
代码编织者
07-03 10:20:07
上下文缓存
成本降低
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序