1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
招商证券:Token出海电力弹性测算 算电协同驱动用电量增长
招商证券近日指出,Token出海推动算力规模扩张,预计到2030年数据中心用电量将占我国全社会用电量约4%,电力需求显著增长。同时,具备重资产、低淘汰特性的公用事业企业(HALO)迎来价值回归。这类资产因进入门槛高、业务模式稳定、现金流可预测且难以被AI颠覆,在技术变革与地缘政治动荡中展现防御性优势。AI时代下,公用事业或成资金避险的确定性选择,凸显长期投资价值。
镜像现实MirageX
03-03 16:19:21
HALO资产
Token出海
算电协同
分享至
打开微信扫一扫
内容投诉
生成图片
中国银河证券:国产大模型Token通胀 持续关注恒生互联网科技巨头低位布局机会
3月3日,中国银河证券发布研报指出,随着国产大模型能力提升,行业进入淘汰赛阶段,可能引发token通胀。原生大模型公司因业务纯粹性短期受资金追捧,但传统互联网巨头在AI时代流量入口竞争中仍具优势,流量是AI时代重要资产。长期来看,互联网公司有望凭借流量优势重获主导地位,原生大模型厂商或成产业链关键部分。建议关注恒生互联网科技巨头的低位布局机会。
未来笔触
03-03 16:18:13
Token通胀
国产大模型
恒生互联网科技巨头
分享至
打开微信扫一扫
内容投诉
生成图片
中信证券:国产大模型超预期 重视国产算力投资机遇
2026年春节期间,国产大模型token调用量激增,截至2月22日的一周内,全球大模型token用量前三名均为国产模型。中信证券研报指出,这一增长反映了AI推理需求的指数级扩容,国产算力因成本优势与生态完善有望在基础设施领域占据主导地位。建议关注超节点互联密度提升带来的投资机遇,包括光通信、高速线模组、交换芯片及交换机、IDC等关键环节。
量子黑客
02-25 09:02:17
token调用量
国产大模型
国产算力
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax M2.5发布
2026年2月13日,MiniMax M2.5正式发布,新版本优化了复杂任务的拆解能力与思考过程中的token消耗,显著提升了处理Agentic任务的效率。在SWE-Bench Verified测试中,M2.5比上一版本M2.1任务完成速度提升37%。运行成本方面,在每秒输出100个token的情况下,连续工作一小时需1美元;若为每秒50个token,则仅需0.3美元。这意味着1万美元可支持4个Agent连续工作一年。此次升级兼顾性能与经济性,为用户带来更高效的使用体验。
代码编织者
02-13 08:07:07
MiniMax M2.5
Token消耗
复杂任务
分享至
打开微信扫一扫
内容投诉
生成图片
AI编程节省95% token,工具调用上限狂飙20倍,开源记忆系统登顶GitHub热榜
AI编程节省95% Token,工具调用上限提升20倍,开源记忆系统Claude-Mem登顶GitHub热榜 Claude-Mem是一款开源记忆系统,解决了AI编程助手跨会话失忆的痛点。传统AI每次新会话都需要重新解释项目背景,浪费时间和Token。Claude-Mem通过本地环境的记忆系统,记...
新智燎原
02-08 13:06:14
Claude-Mem
Token节省
持久化记忆系统
分享至
打开微信扫一扫
内容投诉
生成图片
曦望发布推理GPU S3:All-in推理的国产GPU,开始算单位Token成本
1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
心智奇点
01-27 23:39:42
单位Token成本
推理GPU
曦望
分享至
打开微信扫一扫
内容投诉
生成图片
字节Seed:大概念模型来了,推理的何必是下一个token
字节Seed:大概念模型来了,推理的何必是下一个token LLM的推理单位,为什么一定要是Token?字节Seed团队最新研究——DLCM(Dynamic Large Concept Models),将大模型的推理单位从Token(词)提升到Concept(概念)层级。通过端到端学习语义边界,动态...
幻彩逻辑RainbowLogic
01-05 13:02:57
DLCM
token
概念模型
分享至
打开微信扫一扫
内容投诉
生成图片
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
推理成本降至1元/每百万token,浪潮信息突破AI规模化瓶颈 允中 发自 凹非寺 量子位 | 公众号 QbitAI 全球AI产业已从模型性能竞争转向智能体规模化落地的关键阶段,“降本”成为决定AI企业盈利与行业突破的核心。在此背景下,浪潮信息推出元脑HC1000超扩展AI服务器,将推理成本首次...
QuantumHacker
12-26 15:45:08
AI计算架构
token成本
推理成本
分享至
打开微信扫一扫
内容投诉
生成图片
飞猪《2025旅行AI指数》:Token消耗量涨20倍,日均用户调用次数增7.7倍
12月23日,飞猪发布《2025旅行AI指数》,显示其消费级AI能力已广泛应用,Token消耗量同比增长20倍,日均用户调用次数增7.7倍。旅行AI在售前咨询、商品挑选、售后服务等环节实现落地,尤其在省心和省钱方面表现突出,如提供特价机票、错峰出行方案等。数据显示,凌晨和银发族成为高频使用群体,最年长用户达88岁。此外,AI工具在行程规划中占比近30%,生成信息更直观且交互便捷性提升。平台商家调用AI运营工具次数同比增2.4倍,AI发品助手使用次数增13倍。飞猪AI累计收到约13亿次正向反馈,用户满意度较高。
心智奇点
12-25 12:32:12
Token消耗量
旅行AI
用户调用次数
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law MiniMax海螺视频团队近日开源了一项重要成果,解决了困扰行业已久的难题:为什么增加视觉分词器(Tokenizer)的算力投入,却无法显著提升生成模型的效果? 当前主流的图像/视频生成模型采用“两阶段”框架:...
月光编码师
12-22 13:45:27
Scaling Law
Tokenizer
视觉分词器
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序