
工作原理
Cline 会监控对话过程中的令牌使用情况。当您接近限制时,他会:- 创建对已发生事件的全面摘要
- 保留所有技术细节、代码更改和决策
- 用摘要替换对话历史记录
- 从他离开的地方继续工作
重要性
以前,当达到上下文限制时,Cline 会截断较旧的消息。这意味着会丢失对话早期的一些重要上下文。 现在有了摘要功能:- 所有技术决策和代码模式都得以保留
- 文件更改和项目上下文保持完整
- Cline 记得他所做的一切
- 您可以处理更大的项目而不会中断
技术细节
摘要是通过您配置的 API 提供商使用您正在使用的相同模型进行的。它利用提示缓存来最大限度地降低成本。 不同的模型有不同的上下文窗口阈值,当达到阈值时会自动触发摘要。您可以在 context-window-utils.ts 中查看如何确定阈值。成本考量
摘要利用了对话中现有的提示缓存,因此成本与任何其他工具调用大致相同。 由于大多数输入令牌都已缓存,您主要支付的是摘要生成(输出令牌)的费用,使其非常划算。使用检查点恢复上下文
您可以使用 检查点来恢复摘要发生之前的任务状态。这意味着您永远不会真正丢失上下文 - 您始终可以回滚到对话的早期版本。在摘要工具调用之前编辑消息将类似于检查点,允许您将对话恢复到该点。
下一代模型支持
自动压缩使用基于 LLM 的高级摘要功能,我们发现这对下一代模型效果显著更好。我们目前支持以下模型的此功能:- Claude 4 系列
- Gemini 2.5 系列
- GPT-5
- Grok 4
当使用其他模型时,即使在设置中启用了自动压缩,Cline 也会自动回退到标准的基于规则的上下文截断方法。

