Claude Code缓存故障:用户使用额度为何神秘暴增?

近期,一项由独立开发者通过技术监控发现的严重问题,将AI编程助手Claude Code推上了风口浪尖。数据显示,在过去一个月内,该工具的提示缓存读取率异常低下,仅为4%至17%,远低于正常状态下97%至99%的水平。这一技术故障直接导致用户在使用“恢复会话”功能时,系统无法有效复用已处理的对话历史,每次交互都需从零开始重新计算,使得API调用额度消耗激增至正常情况的10到20倍。

技术故障的发现与影响

开发者ArkNill通过设置透明代理,详细记录了Claude Code客户端与Anthropic API服务器之间的通信。分析发现,至少存在两个客户端缓存错误,导致服务器无法正确匹配已缓存的对话前缀。这使得每次请求都触发完整的令牌重建,而非高效的缓存读取。

版本迭代数据清晰地揭示了问题的时间线:在v2.1.69至v2.1.89版本期间,独立客户端的缓存读取率持续低迷。直到v2.1.90版本修复了一个关键错误后,冷启动缓存读取率才回升至47%至99.7%的区间。最终在v2.1.91版本中,系统才恢复到97%至99%的稳定高效状态。

一个关键细节在于,在修复版本中,会话恢复初期存在一个短暂的缓存“预热”过程,前几轮命中率较低但会迅速提升。而在故障版本中,系统提示词的14,500个令牌之后的所有对话历史,每一次都被全额计费,预热机制完全失效。

长达28天的故障周期与官方应对

此次故障并非短暂出现。根据npm的发布记录,引入错误的v2.1.69版本发布于3月4日,而修复版本v2.1.90直到4月1日才发布,中间横跨28天,经历了20个版本迭代。

值得注意的是,用户大规模投诉在3月23日左右才集中爆发,距离错误引入已近三周。据GitHub相关议题分析,这很可能是因为Anthropic在3月13日至28日期间推出了非高峰时段额度翻倍的促销活动,暂时掩盖了缓存错误带来的超额消耗。促销结束后,问题才彻底暴露。

面对用户投诉,Anthropic的官方回应显得迟缓且分散。3月26日,有工程师通过个人社交账号提及高峰时段限额收紧。3月30日,公司才在Reddit上承认用户达到限额的速度“远超预期”。直到4月1日,工程师Lydia Hallie才发布了正式的调查结论。整个过程中,公司未通过官方博客、邮件或状态页进行统一通报,所有信息均散见于个人社交媒体和论坛评论。

用户遭遇的真实损失

在GitHub上汇集了数百条用户报告。其中,订阅200美元/月“Max 20x”计划的用户反映,其5小时滚动额度在19分钟内耗尽。另一位100美元/月的“Max 5x”用户则表示,额度在90分钟内用完。甚至有用户报告,发送一条简单的“hello”消息就消耗了13%的会话配额。

根据基准测试,在存在错误的v2.1.89版本上,“Max 20x”计划的全部配额大约在70分钟内就会耗尽。恢复一个包含50万令牌上下文的会话,单次操作的成本就高达约0.15美元。

官方建议引发的争议

Lydia Hallie在调查结论中确认了高峰时段限额收紧以及百万令牌上下文会话消耗增大的事实。她表示团队修复了一些错误,但坚称“没有任何一个错误导致了多收费”。

随后,官方给出了四条节省额度的建议:

  1. 使用Sonnet 4.6模型,而非消耗更快的旗舰Opus模型;
  2. 在不需要深度推理时,降低推理强度或关闭扩展思考功能;
  3. 对于闲置超过一小时的长会话,建议重新开启而非恢复;
  4. 通过设置环境变量来限制上下文窗口大小。

这些建议并未包含任何额度重置或补偿方案,引发了用户强烈不满。AI播客主持人Alex Volkov批评此举类似于“你的使用方式不对”,指出Anthropic自身将百万令牌上下文、Opus模型和扩展思考作为核心卖点推广,却在出现问题后建议付费用户避免使用这些功能。

此外,“没有多收费”的声明也与版本更新记录存在矛盾。在Lydia发布回应的前一天,v2.1.90版本修复了一个自v2.1.69起存在的缓存回归错误,该错误明确导致了恢复会话时本应命中的缓存失效,从而按全价计费。这一点在官方回应中未被提及。

与此形成对比的是,OpenAI在旗下Codex产品出现类似额度异常消耗问题时,采取了为用户重置配额、补发积分,并最终移除使用上限的解决方式。

Anthropic以提供“最强模型、最大上下文、最高推理能力”为承诺,收取每月20至200美元的费用。然而,一个持续28天的缓存错误导致用户额度急剧蒸发后,官方的核心回应却是让用户“省着点用”。

青岚个人视点

此次Claude Code事件暴露的远不止一个技术Bug。它更像是一个关于产品责任、企业沟通与用户信任的压力测试。当一家以“安全、可靠”为立身之本的AI公司,其核心产品出现长达近一个月的计费异常,且官方沟通渠道失声、回应迟缓、归因于用户时,其品牌承诺便显得苍白。技术缺陷难免,但处理缺陷的方式定义了公司的品格。将“降级使用核心功能”作为解决方案,不仅是对付费用户价值的折损,更是对自身产品定位的背离。在竞争白热化的AI赛道,技术领先固然重要,但构建于透明、负责和用户同理心之上的信任,才是更坚固的护城河。Anthropic的当务之急,或许不是修复代码,而是修复与用户之间的契约。


🔥 这篇深度分析够不够劲?群里还有更多加密专题干货!

想跟志同道合的朋友一起聊趋势?赶紧进群→青岚免费交易社群 (电报)

💡 感谢阅读

1、市场风云变幻,以上仅为青岚姐个人的复盘与思考,不作为任何投资建议。在加密市场的长跑中,比起预测,更重要的是执行——请务必管好仓位,严带止损,愿我们且行且珍惜,在每一轮波动中稳健前行!

2、关于如何合理设置止盈止损,请点这里查看青岚姐的教程。

3、本文由青岚加密课堂整理优化,如需转载请注明出处。