综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
招商证券近日指出,Token出海推动算力规模扩张,预计到2030年数据中心用电量将占我国全社会用电量约4%,电力需求显著增长。同时,具备重资产、低淘汰特性的公用事业企业(HALO)迎来价值回归。这类资产因进入门槛高、业务模式稳定、现金流可预测且难以被AI颠覆,在技术变革与地缘政治动荡中展现防御性优势。AI时代下,公用事业或成资金避险的确定性选择,凸显长期投资价值。
原文链接
3月3日,中国银河证券发布研报指出,随着国产大模型能力提升,行业进入淘汰赛阶段,可能引发token通胀。原生大模型公司因业务纯粹性短期受资金追捧,但传统互联网巨头在AI时代流量入口竞争中仍具优势,流量是AI时代重要资产。长期来看,互联网公司有望凭借流量优势重获主导地位,原生大模型厂商或成产业链关键部分。建议关注恒生互联网科技巨头的低位布局机会。
原文链接
2026年春节期间,国产大模型token调用量激增,截至2月22日的一周内,全球大模型token用量前三名均为国产模型。中信证券研报指出,这一增长反映了AI推理需求的指数级扩容,国产算力因成本优势与生态完善有望在基础设施领域占据主导地位。建议关注超节点互联密度提升带来的投资机遇,包括光通信、高速线模组、交换芯片及交换机、IDC等关键环节。
原文链接
2026年2月13日,MiniMax M2.5正式发布,新版本优化了复杂任务的拆解能力与思考过程中的token消耗,显著提升了处理Agentic任务的效率。在SWE-Bench Verified测试中,M2.5比上一版本M2.1任务完成速度提升37%。运行成本方面,在每秒输出100个token的情况下,连续工作一小时需1美元;若为每秒50个token,则仅需0.3美元。这意味着1万美元可支持4个Agent连续工作一年。此次升级兼顾性能与经济性,为用户带来更高效的使用体验。
原文链接
AI编程节省95% Token,工具调用上限提升20倍,开源记忆系统Claude-Mem登顶GitHub热榜
Claude-Mem是一款开源记忆系统,解决了AI编程助手跨会话失忆的痛点。传统AI每次新会话都需要重新解释项目背景,浪费时间和Token。Claude-Mem通过本地环境的记忆系统,记...
原文链接
1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
原文链接
字节Seed:大概念模型来了,推理的何必是下一个token
LLM的推理单位,为什么一定要是Token?字节Seed团队最新研究——DLCM(Dynamic Large Concept Models),将大模型的推理单位从Token(词)提升到Concept(概念)层级。通过端到端学习语义边界,动态...
原文链接
推理成本降至1元/每百万token,浪潮信息突破AI规模化瓶颈
允中 发自 凹非寺
量子位 | 公众号 QbitAI
全球AI产业已从模型性能竞争转向智能体规模化落地的关键阶段,“降本”成为决定AI企业盈利与行业突破的核心。在此背景下,浪潮信息推出元脑HC1000超扩展AI服务器,将推理成本首次...
原文链接
12月23日,飞猪发布《2025旅行AI指数》,显示其消费级AI能力已广泛应用,Token消耗量同比增长20倍,日均用户调用次数增7.7倍。旅行AI在售前咨询、商品挑选、售后服务等环节实现落地,尤其在省心和省钱方面表现突出,如提供特价机票、错峰出行方案等。数据显示,凌晨和银发族成为高频使用群体,最年长用户达88岁。此外,AI工具在行程规划中占比近30%,生成信息更直观且交互便捷性提升。平台商家调用AI运营工具次数同比增2.4倍,AI发品助手使用次数增13倍。飞猪AI累计收到约13亿次正向反馈,用户满意度较高。
原文链接
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law
MiniMax海螺视频团队近日开源了一项重要成果,解决了困扰行业已久的难题:为什么增加视觉分词器(Tokenizer)的算力投入,却无法显著提升生成模型的效果?
当前主流的图像/视频生成模型采用“两阶段”框架:...
原文链接
加载更多
暂无内容