① 上下文是什么
想象你在跟一个助理聊天。
上下文 = 助理能记住的最近说了什么
窗口满了 → 助理忘记前面说过的话 → 你又要重新说一遍
上下文 = 助理能记住的最近说了什么
窗口满了 → 助理忘记前面说过的话 → 你又要重新说一遍
Claude Code 的上下文窗口是 200K tokens(约等于 150,000 个中文字)。听起来很多,但如果你开了很多工具(MCP)、加载了很多文件,很快就满了。
⚠️ MCP 插件开多了是上下文杀手。开了 20 个 MCP,200K 的窗口可能只剩 70K 给你用。
② 怎么看用了多少
敲这个命令:
/context-budget会显示:
- 总窗口大小:200K tokens
- 已用多少
- 还剩多少
- 什么在占用(对话、文件、工具)
💡 每次感觉 Claude "变笨了"的时候,先敲 /context-budget 看看是不是上下文满了。
③ 节省上下文的 6 个方法
| 方法 | 怎么做 | 效果 |
|---|---|---|
| 关掉不用的 MCP | /mcp → 只保留 10 个以内 | 节省 30-50% 上下文 |
| 打 Checkpoint | 关键节点敲 /checkpoint | 防止丢失进度 |
| 手动压缩 | 敲 /compact 触发压缩 | 腾出空间继续工作 |
| 分叉对话 | /fork 并行处理不相关的任务 | 避免混在一起浪费 token |
| 新开对话 | 完全不相关的任务直接开新会话 | 从零开始,上下文干净 |
| 精准引用文件 | 用 @文件名 而不是让 Claude 去搜 | 减少搜索消耗 |
④ 选对模型省大钱
不同模型价格差 10 倍以上。选对了,效果一样好但便宜很多:
| 场景 | 推荐模型 | 原因 |
|---|---|---|
| 简单问询、查文档 | Haiku | 便宜、快,简单活没必要用大炮 |
| 日常开发、代码审查 | Sonnet | 性价比最高,90% 的任务都能胜任 |
| 复杂架构、安全审查 | Opus | 推理最强,关键时刻才用 |
💡 不确定该用哪个?敲
/model-route 帮我分析这个需求该用哪个模型🟢 省钱口诀:日常用 Sonnet,简单用 Haiku,搞不定了再上 Opus。
⑤ Checkpoint — 关键时刻存档
上下文满了 Claude 会"忘记"前面说过的话。在关键节点打 Checkpoint:
/checkpoint什么时候打:
- 完成一个重要功能模块后
- 对话很长了(感觉 Claude 开始"失忆"之前)
- 要做一个大改动但不确定能不能成
打 Checkpoint 后可以随时回退,不用从头再来。
⑥ 练习
- 敲
/context-budget,看看你当前用了多少上下文 - 敲
/mcp,关掉 3 个不常用的 MCP 插件 - 在一个关键节点敲
/checkpoint存档 - 下次遇到简单问题,敲
/model-route让它帮你选便宜的模型
⑦ 速查卡
| 我想... | 敲这个 |
|---|---|
| 看用了多少上下文 | /context-budget |
| 关掉不用的插件 | /mcp |
| 压缩上下文腾空间 | /compact |
| 存档防丢失 | /checkpoint |
| 分叉并行处理 | /fork |
| 分析该用哪个模型 | /model-route |