跳过主要内容
当您的对话接近模型的上下文窗口限制时,Cline 会自动对其进行摘要,以释放空间并继续工作。
Auto-compact feature condensing conversation context

工作原理

Cline 会监控对话过程中的令牌使用情况。当您接近限制时,他会:
  1. 创建对已发生事件的全面摘要
  2. 保留所有技术细节、代码更改和决策
  3. 用摘要替换对话历史记录
  4. 从他离开的地方继续工作
当这种情况发生时,您会看到一个摘要工具调用,显示总成本,就像聊天视图中的任何其他 API 调用一样。

重要性

以前,当达到上下文限制时,Cline 会截断较旧的消息。这意味着会丢失对话早期的一些重要上下文。 现在有了摘要功能:
  • 所有技术决策和代码模式都得以保留
  • 文件更改和项目上下文保持完整
  • Cline 记得他所做的一切
  • 您可以处理更大的项目而不会中断
上下文摘要与 焦点链(Focus Chain)完美协同。启用焦点链后,待办事项列表会在摘要过程中保留下来。这意味着 Cline 可以处理跨越多个上下文窗口的长期任务,同时通过指导他完成每次重置的待办事项列表保持正轨。

技术细节

摘要是通过您配置的 API 提供商使用您正在使用的相同模型进行的。它利用提示缓存来最大限度地降低成本。
  1. Cline 使用 摘要提示来请求对话摘要。
  2. 生成摘要后,Cline 会用一个 继续提示替换对话历史记录,该提示要求 Cline 继续工作并提供摘要作为上下文。
不同的模型有不同的上下文窗口阈值,当达到阈值时会自动触发摘要。您可以在 context-window-utils.ts 中查看如何确定阈值。

成本考量

摘要利用了对话中现有的提示缓存,因此成本与任何其他工具调用大致相同。 由于大多数输入令牌都已缓存,您主要支付的是摘要生成(输出令牌)的费用,使其非常划算。

使用检查点恢复上下文

您可以使用 检查点来恢复摘要发生之前的任务状态。这意味着您永远不会真正丢失上下文 - 您始终可以回滚到对话的早期版本。
在摘要工具调用之前编辑消息将类似于检查点,允许您将对话恢复到该点。

下一代模型支持

自动压缩使用基于 LLM 的高级摘要功能,我们发现这对下一代模型效果显著更好。我们目前支持以下模型的此功能:
  • Claude 4 系列
  • Gemini 2.5 系列
  • GPT-5
  • Grok 4
当使用其他模型时,即使在设置中启用了自动压缩,Cline 也会自动回退到标准的基于规则的上下文截断方法。