Token消耗 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

别担心被AI抢饭碗了！老板算完账可能发现你更划算

今年以来，国内外科技企业掀起“Token崇拜”热潮，甚至将AI的Token消耗量纳入员工KPI。然而企业很快发现账算不过来：Uber四个月烧光全年AI预算并紧急限额，微软收回部分AI许可证，更有公司单月狂烧5亿美元。事实证明，Token消耗量无法与实际产出划等号，盲目使用AI反致“降本增笑”。因AI现阶段仍需人工辅助纠错，其“工资+算力”的综合成本甚至高于直接雇人。目前行业已回归理智，腾讯等大厂开始限制Token额度，部分SaaS企业转为按效果收费。老板算完账发现人工性价比更高，打工人暂不必担心被AI抢饭碗。

原文链接

Nebula

07-07 00:56:12

分享至

打开微信扫一扫

内容投诉

生成图片

烧不起了！Meta喊停Token消耗战明年起将限制预算

近日，Meta发布内部备忘录，宣布将限制内部AI的Token消耗，计划于2027年正式推行预算和配额管理机制。此前，Meta内部推崇“词元消耗最大化”，员工30天内消耗超60万亿个Token，成本高达9亿美元，却未产出实质价值。CEO扎克伯格承认AI转型犯错，并引导员工转向内部编程助手MetaCode以控制成本。不仅是Meta，亚马逊已停用Token消耗榜单，OpenAI CEO也质疑Token增加未带来生产力提升。目前，硅谷大厂对Token消耗趋于理性，行业风向转向“词元消耗最小化”，逐步从按Token计费向按结果计费转变。

原文链接

小阳哥

06-16 00:19:28

分享至

打开微信扫一扫

内容投诉

生成图片

蚂蚁集团：Token消耗将迎来指数级增长 2030年预计消耗量增长超300倍

5月26日，支付宝在AI支付生态大会上，蚂蚁集团研究院院长庄蹯指出，Token、数据和工具正成为智能体运行的核心要素，并预测Token消耗将迎来指数级增长。预计到2030年，Token消耗量将增长超300倍，届时活跃智能体数量将达到22亿，年执行任务次数可达400万亿次。这一趋势凸显了数字资源在未来智能化发展中的重要性，为AI技术的广泛应用提供了关键支撑。

原文链接

GhostPilot

05-26 15:35:31

分享至

打开微信扫一扫

内容投诉

生成图片

“五类人AI替代不了，企业做第二名最稳妥” | 昆仑万维方汉@AIGC2026

2026年5月，在中国AIGC产业峰会上，昆仑万维CEO方汉分享了对AI时代的深刻洞察。他指出，Token消耗量正成为AI实力的新指标，类似“小龙虾”创始人月耗6000亿Token的现象凸显差距。他认为，闭环且可容错的岗位易被AI取代，但高判断力、不可容错的工作仍需人类主导。方汉强调，讲故事的人、创造idea的人、定义美的人、构建系统的人及重塑范式的人是AI无法替代的五类人。他还建议企业在AI落地中选择做第二名，避免第一名的高试错成本和第三名的红利缺失。峰会吸引了超千名线下观众与近400万线上观众，展示了AI对未来工作与生活的深远影响。

原文链接

WisdomTrail

05-23 18:55:47

分享至

打开微信扫一扫

内容投诉

生成图片

龙虾之父月烧940万元的token！要不是入职OpenAI还真用不起

2026年5月，知名开发者‘龙虾之父’Peter Steinberger在社交媒体上分享其过去30天使用OpenAI API的惊人数据：花费高达130万美元（约合人民币940万元），消耗6030亿token，发起760万次请求，主要用于开发OpenClaw项目。他透露，团队仅3人，但通过云端运行约100个Codex Agent实现多Agent协作，完成代码审查、漏洞扫描等任务。尽管费用高昂，Peter表示若关闭‘快速模式’，成本可降低70%，且效率仍远超人类工程师。他认为这种模式回报率高，尤其在软件开发逐渐转向‘人类管理AI团队’的趋势下。此外，他还透露正在筹备多个创业项目，未来或进一步扩展AI应用规模。

原文链接

E-Poet

05-17 14:40:19

分享至

打开微信扫一扫

内容投诉

生成图片

NVIDIA：AI其实比真人更贵！但是企业不在乎

2026年4月30日，NVIDIA和Uber高管透露，AI使用成本远高于人力成本，但企业仍热衷于用AI替代员工。NVIDIA副总裁Bryan Catanzaro表示，算力成本已超过员工成本，而Uber CTO Praveen Naga称其预算因AI超支，甚至计划将软件开发全面转向AI驱动。研究显示，77%情况下人工比AI更高效且便宜，但企业为实现核心流程自动化，不惜投入巨资并大规模裁员。例如，Uber已有11%代码由AI编写。此外，NVIDIA创始人黄仁勋提出以Token消耗量衡量工程师生产力，要求年薪50万美元的工程师每年消耗25万美元Token。尽管成本高昂，AI部署与裁员趋势将持续。

原文链接

AGI探路者

04-30 10:11:14

分享至

打开微信扫一扫

内容投诉

生成图片

Claude终于承认乱扣费！最高多收你20倍，一句「你好」干掉13%额度

2026年4月，Claude Code因乱扣费问题引发用户强烈不满。Anthropic官方承认，用户使用上限消耗过快的问题属实，正在紧急排查并承诺尽快更新进展。此前，Reddit网友曝光两个技术漏洞，导致计费成本膨胀10～20倍，prompt缓存失效使费用大幅增加。例如，一句“你好”消耗13%额度，11分钟工作耗掉23%额度，甚至一个提示词占31%额度。部分用户反映降级到旧版本（如2.1.34）有所改善。此外，促销活动结束及高峰时段配额降低也加剧了用户体感缩水。网友批评Anthropic售后响应迟缓，与竞争对手OpenClaw快速修复问题形成鲜明对比。此次事件凸显AI服务中持续交付和用户反馈的重要性。

原文链接

未来编码者

04-01 13:49:28

分享至

打开微信扫一扫

内容投诉

生成图片

阿里巴巴：百炼MaaS平台Token消耗3个月升6倍将成阿里云最大收入产品

3月19日，在阿里巴巴集团2026财年第三财季分析师电话会上，CEO吴泳铭透露，阿里已构建从AI基础设施到应用的全栈AI能力，并加速推进MaaS平台建设。过去三个月，百炼MaaS平台的公共模型服务市场Token消耗规模增长6倍，显示出强劲需求。预计商业化MaaS收入将成为阿里云未来最大的收入来源，进一步巩固其在AI领域的领先地位。

原文链接

QuantumHacker

03-19 20:31:44

分享至

打开微信扫一扫

内容投诉

生成图片

Gartner：Token消耗是衡量AI市场领导力的误导性指标

2026年3月10日，Gartner发文指出，AI行业中越来越多厂商将token消耗量视为衡量市场领导力的指标，但这一做法具有误导性。文章强调，快速增长的token消耗并不能反映AI的长期可行性，因其无法准确评估AI成功与否，还可能误导企业决策者。Gartner认为，真正决定AI长期可行性的关键在于变现原则、利润率可持续性和企业渗透率。AI领导者应弱化token指标，转而关注解决方案能力、决策赋能效果、成本可预测性及可量化业务成果，以更科学地评估AI厂商的实际价值。

原文链接

智能维度跳跃

03-10 14:25:25

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax M2.5发布

2026年2月13日，MiniMax M2.5正式发布，新版本优化了复杂任务的拆解能力与思考过程中的token消耗，显著提升了处理Agentic任务的效率。在SWE-Bench Verified测试中，M2.5比上一版本M2.1任务完成速度提升37%。运行成本方面，在每秒输出100个token的情况下，连续工作一小时需1美元；若为每秒50个token，则仅需0.3美元。这意味着1万美元可支持4个Agent连续工作一年。此次升级兼顾性能与经济性，为用户带来更高效的使用体验。

原文链接