Claude Developer Console 现已上线 Prompt Caching Dashboard,用户可通过 platform.claude.com/usage/cache 访问。
该仪表盘支持按工作区、模型和时间段筛选,核心展示以下数据:
- 缓存读取率:请求命中已有缓存的比例。
- 缓存用量构成:通过堆叠条形图,将输入 token 分为四类:
- 未缓存
- 5分钟缓存写入
- 1小时缓存写入
- 缓存读取
- 写入摊销倍数:衡量单次缓存写入被后续读取复用的次数。
示例数据:在示例截图中,Claude Opus 模型在7天内处理了27.4亿输入token,缓存读取率达到85.4%,写入摊销倍数为8.65倍。
仪表盘底部还提供了缓存读取率的时序图,时间粒度可从1小时调整至24小时。
背景与价值:
Anthropic的提示缓存机制允许API用户将系统提示、长上下文等固定内容标记为可缓存。首次写入会产生额外费用,但后续命中缓存的请求,其输入token费用约为标准价格的十分之一。缓存默认保留5分钟,付费可延长至1小时。
此前,用户仅能通过API返回的token计数字段间接评估缓存效果,此可视化仪表盘的推出提供了更直观的成本与效能分析工具。