Anthropic Claude Code团队工程师Thariq Shihipar详解了如何有效管理Claude升级至百万token上下文窗口后的长会话,并更新了/usage面板以帮助用户分析使用模式。
核心挑战:上下文腐烂
随着对话增长,模型注意力被分散到大量token上,旧的、无关内容会干扰当前任务,导致模型表现下降,这种现象被称为“上下文腐烂”。百万上下文窗口虽支持更长任务跨度,但并不意味着可以无限堆积对话。
关键习惯:善用Rewind
用户最应养成的习惯是使用rewind(双击Esc键)。当Claude尝试的方案失败时,更好的做法不是发送“这个不行,试试X”,而是回退到方案执行前,将失败经验写入新的提示词重新开始,避免失败的中间过程留在上下文中占用注意力。
谨慎使用上下文压缩
上下文压缩(compaction)存在一个反直觉问题:模型在最需要判断力的时候反而表现最差。压缩通常发生在上下文即将撑满、上下文腐烂最严重的时刻,模型容易丢弃关键信息。例如,长时间调试后触发自动压缩,摘要可能聚焦于调试过程,而用户下一步要处理的其他问题却被忽略。
百万token上下文提供了更多操作空间。用户可以在手动输入/compact时附加指令(如“只保留auth重构相关内容”),主动引导压缩方向。
利用子代理管理上下文
建议将子代理(subagents)视为上下文管理工具。将产生大量中间输出但只需最终结论的任务交给子代理,在独立上下文窗口中完成,仅将结果带回主会话。判断标准是:“我需要的是过程还是结论?”
会话结束后的五个选择
每轮对话结束后,用户面临五个选择:
- 继续对话
- Rewind回退重试
/clear清空并重新开始/compact压缩后继续- 派出子代理处理
对于新任务,建议开启新会话。相关任务(如编写功能后接着写文档)可留在同一会话中以复用已读取的文件。