1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
首个大规模记忆湖发布,AI Infra跑步进入“记忆”时代
正文:2026年2月5日,质变科技发布首个大规模记忆湖产品MemoryLake,标志着AI基础设施进入‘记忆’时代。MemoryLake集成了大模型、记忆引擎和多模态存储计算平台,具备超大规模实践能力,可处理10万亿级记录和亿级文档,性能指标显著优于竞争对手。该产品通过分层管理短期、中期、长期记忆,支持跨端、跨域通用,并兼容多种主流协议,大幅降低企业部署成本。其核心优势在于多模态数据深度理解与精准提取能力,能将文本、音视频等非结构化数据转化为可靠记忆资产。此外,MemoryLake在长程对话记忆基准测试LoCoMo中以94%的综合得分位列全球第一。目前,MemoryLake已服务150万专业用户和1.5万家企业,覆盖金融、制造、游戏等多个行业,帮助企业实现隐性知识数字化和核心能力沉淀。
像素宇宙
02-05 15:56:01
AI Infra
MemoryLake
记忆平台
分享至
打开微信扫一扫
内容投诉
生成图片
腾讯混元AI Infra核心技术开源:推理吞吐提升30%
2月4日,腾讯混元AI Infra团队开源高性能LLM推理核心算子库HPC-Ops。在真实场景下,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能方面,HPC-Ops的Attention较FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM较DeepGEMM最高提升1.88倍,FusedMoE较TensorRT-LLM最高提升1.49倍。该技术开源为行业提供生产级解决方案,显著优化推理效率,展现技术领先性与实用性。
电子诗篇
02-04 19:00:46
AI Infra
HPC-Ops
腾讯混元
分享至
打开微信扫一扫
内容投诉
生成图片
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025年12月,商汤大装置副总裁宣善明在量子位MEET2026智能未来大会上分享了商汤在AI基础设施领域的最新进展。他指出,真正面向大模型的AI Infra需兼顾算力高效性、稳定性和规模化支撑能力。商汤通过‘1+X’战略推进核心业务与创新布局,其智算中心已实现32000P算力规模,并通过算电协同技术年化降低7%电费,减少碳排放超3000吨。此外,商汤联合十余家厂商发布‘算力Mall’,支持国产化适配与多样化算力调配,助力行业模型落地。目前,商汤大装置已在互联网、传统行业及科研领域实现深度应用,为合作伙伴提供端到端解决方案,推动AI技术产业落地。
AI奇点纪元
12-22 10:35:49
AI Infra
商汤大装置
大模型
分享至
打开微信扫一扫
内容投诉
生成图片
做难而正确的AI Infra创新——专访国产大模型推理引擎xLLM社区负责人刘童璇
12月6日,国产大模型推理引擎xLLM社区将在北京举办“共建开源AI Infra生态”线下Meetup。xLLM于今年8月底开源,由一支平均年龄不到30岁的团队开发,旨在为国产芯片提供专属推理引擎,支持生成式推荐、文生图、文生视频等场景,并在昇腾等国产硬件上性能优于国际方案。项目负责人刘童璇表示,团队选择了一条‘难而正确’的技术路径,从零构建完整技术栈闭环。xLLM已应用于新疆电站等实际场景,展现广泛落地价值。未来一年,xLLM将聚焦场景纵深、模型联盟和芯片协同三大方向,目标成为数据中心级智能操作系统,助力‘人工智能+’国家战略。
月光编码师
12-02 12:08:01
AI Infra
xLLM
国产芯片
分享至
打开微信扫一扫
内容投诉
生成图片
xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态
12月6日,xLLM社区将在北京举办主题为“共建开源 AI Infra 生态”的线下Meetup。作为成立仅三个月的新兴社区,xLLM首次全面展示其技术愿景、核心规划及生态全景,定位为下一代大模型推理引擎框架,支持多元化AI场景,如大语言模型、多模态生成、文生图和文生视频等。活动将揭秘其创新架构及未来演进方向,并分享与京东11.11大促合作提升业务效率5倍的成果。清华大学副教授章明星将解读Mooncake存储方案,北京智源人工智能研究院门春雷探讨硬件优化实践。xLLM已开源,适配国产算力,与昇腾合作探索高性能推理方案,未来还将联合清华、北大等产学研伙伴推动AI生态协同创新。诚邀开发者、研究者及行业伙伴参与交流。
Journeyman
11-24 21:15:56
xLLM社区
大模型推理
开源AI Infra生态
分享至
打开微信扫一扫
内容投诉
生成图片
百度打造「最硬AI云」,硬在哪里?
标题:百度打造「最硬AI云」,硬在哪里? 2025年被称为“Agent元年”,企业不再满足于围观AI的惊艳表现,而是希望将其融入自身业务,实现增长、提效和创新。然而,AI应用常因无法深度嵌入企业核心系统或适配特殊流程而难以落地。行业共识是,AI需像水电煤一样成为基础能力,才能推动持续智能增长。 ...
阿达旻
11-14 16:07:23
Agent Infra
AI Infra
百度智能云
分享至
打开微信扫一扫
内容投诉
生成图片
离开王慧文的两年,这位创业者赶上了梁文锋的头班车
2023年,创业者袁进辉经历了两段重要历程:3月,其创业项目OneFlow被美团联合创始人王慧文收购,随后加入光年之外;8月,他离开美团,创立硅基流动,专注AI Infra领域。2024年初,硅基流动因率先部署DeepSeek的R1模型实现流量暴涨40倍,成为行业焦点。尽管与DeepSeek创始人梁文锋在开源问题上有分歧,两家公司仍保持业务合作。2025年初,基于V3架构的R1模型爆火,引发流量风暴,硅基流动通过大规模专家并行技术迎战,提升了品牌知名度。最新一轮融资由阿里云领投,金额达数亿元。袁进辉认为,AI行业的关键在于商业化,而硅基流动将聚焦高增长,探索公有云、私有部署及海外市场,力求在竞争中抓住商机。
AI幻想空间站
08-27 09:03:24
AI Infra
商业化
大规模专家并行
分享至
打开微信扫一扫
内容投诉
生成图片
Agent狂欢下的冷思考
2025年,Agent成为AI主流叙事,全球市场规模突破50亿美元,预计2030年达500亿美元。然而,企业在部署Agent时发现效果未达预期,问题根源在于忽视了AI Infra的重要性。AI Infra核心是数据闭环,驱动模型优化,而Agent平台仅属应用层,缺乏底层支撑能力。数据显示,中国AI Infra市场规模2025年预计达36.1亿元,同比增长超86%。企业需构建Data&AI一体化基础设施,融合多模态数据处理、低代码开发与动态智能调度能力。科杰科技等厂商已推出相关解决方案,并在能源、汽车等行业落地,推动数据与AI深度融合,为企业智能化转型提供关键支撑。
星际Code流浪者
08-13 15:39:12
Agent
AI Infra
Data&AI
分享至
打开微信扫一扫
内容投诉
生成图片
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
标题:Agent热潮背后:为什么Data&AI数据基础设施才是AI时代的核心? 正文: 当Agent成为2025年AI的主流叙事,全球市场规模突破50亿美元时,企业纷纷布局Agent,希望抓住这一波生产力变革的机会。然而,许多企业在部署Agent后发现效果不及预期,问题的根源在于对AI基础设...
星际Code流浪者
08-13 13:35:08
Agent
AI Infra
Data&AI数据基础设施
分享至
打开微信扫一扫
内容投诉
生成图片
关于 AI Infra 的一切
标题:关于 AI Infra 的一切 朱亦博是国内最了解 AI Infra 的人之一,他的职业经历几乎与 AI Infra 的发展并行。 AI Infra 的定义 AI Infra 包括硬件和软件两部分。硬件指 AI 芯片、GPU 和交换机等设备;软件层面可类比云计算,分为三层: - 最底层...
智慧轨迹
08-11 19:08:22
AI Infra
大模型
硬件
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序