综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年4月,Claude Code因乱扣费问题引发用户强烈不满。Anthropic官方承认,用户使用上限消耗过快的问题属实,正在紧急排查并承诺尽快更新进展。此前,Reddit网友曝光两个技术漏洞,导致计费成本膨胀10~20倍,prompt缓存失效使费用大幅增加。例如,一句“你好”消耗13%额度,11分钟工作耗掉23%额度,甚至一个提示词占31%额度。部分用户反映降级到旧版本(如2.1.34)有所改善。此外,促销活动结束及高峰时段配额降低也加剧了用户体感缩水。网友批评Anthropic售后响应迟缓,与竞争对手OpenClaw快速修复问题形成鲜明对比。此次事件凸显AI服务中持续交付和用户反馈的重要性。
原文链接
3月19日,在阿里巴巴集团2026财年第三财季分析师电话会上,CEO吴泳铭透露,阿里已构建从AI基础设施到应用的全栈AI能力,并加速推进MaaS平台建设。过去三个月,百炼MaaS平台的公共模型服务市场Token消耗规模增长6倍,显示出强劲需求。预计商业化MaaS收入将成为阿里云未来最大的收入来源,进一步巩固其在AI领域的领先地位。
原文链接
2026年3月10日,Gartner发文指出,AI行业中越来越多厂商将token消耗量视为衡量市场领导力的指标,但这一做法具有误导性。文章强调,快速增长的token消耗并不能反映AI的长期可行性,因其无法准确评估AI成功与否,还可能误导企业决策者。Gartner认为,真正决定AI长期可行性的关键在于变现原则、利润率可持续性和企业渗透率。AI领导者应弱化token指标,转而关注解决方案能力、决策赋能效果、成本可预测性及可量化业务成果,以更科学地评估AI厂商的实际价值。
原文链接
2026年2月13日,MiniMax M2.5正式发布,新版本优化了复杂任务的拆解能力与思考过程中的token消耗,显著提升了处理Agentic任务的效率。在SWE-Bench Verified测试中,M2.5比上一版本M2.1任务完成速度提升37%。运行成本方面,在每秒输出100个token的情况下,连续工作一小时需1美元;若为每秒50个token,则仅需0.3美元。这意味着1万美元可支持4个Agent连续工作一年。此次升级兼顾性能与经济性,为用户带来更高效的使用体验。
原文链接
标题:开源模型真的更“浪费”token吗?
正文:
近期研究发现,像DeepSeek-R1等开源模型在回答问题时往往显得不够“节制”,尤其是在简单问题上,容易陷入过于复杂的思考。这种冗长的推理过程可能导致其单位token成本优势被抵消。
NousResearch团队的研究试图解答一个关键问题...
原文链接
正文:2025年7月,GMI Cloud在WAIC 2025期间发布“AI应用构建成本计算器”,助力开发者量化海外AI商业化成本。该工具基于Token消耗与吞吐量,实时对比15家供应商性价比,优化总拥有成本(TCO)。数据显示,使用GMI Cloud方案可降低IT成本40%,缩短回本周期至行业平均的1/3。例如,处理900万字任务仅需15小时,远快于某些服务商的83小时,且费用更低。其底层依托英伟达H200、B200芯片,实现硬件到软件的全栈优化,支持快速部署与扩展。用户可通过官网体验工具并了解更多详情。
原文链接
加载更多
暂无内容