自动上下文摘要

当您的对话接近模型的上下文窗口限制时，Cline 会自动对其进行摘要，以释放空间并继续工作。

Auto-compact feature condensing conversation context

工作原理

Cline 会监控对话过程中的令牌使用情况。当您接近限制时，他会：

创建对已发生事件的全面摘要
保留所有技术细节、代码更改和决策
用摘要替换对话历史记录
从他离开的地方继续工作

当这种情况发生时，您会看到一个摘要工具调用，显示总成本，就像聊天视图中的任何其他 API 调用一样。

重要性

以前，当达到上下文限制时，Cline 会截断较旧的消息。这意味着会丢失对话早期的一些重要上下文。现在有了摘要功能：

所有技术决策和代码模式都得以保留
文件更改和项目上下文保持完整
Cline 记得他所做的一切
您可以处理更大的项目而不会中断

上下文摘要与焦点链（Focus Chain）完美协同。启用焦点链后，待办事项列表会在摘要过程中保留下来。这意味着 Cline 可以处理跨越多个上下文窗口的长期任务，同时通过指导他完成每次重置的待办事项列表保持正轨。

技术细节

摘要是通过您配置的 API 提供商使用您正在使用的相同模型进行的。它利用提示缓存来最大限度地降低成本。

Cline 使用摘要提示来请求对话摘要。
生成摘要后，Cline 会用一个继续提示替换对话历史记录，该提示要求 Cline 继续工作并提供摘要作为上下文。

不同的模型有不同的上下文窗口阈值，当达到阈值时会自动触发摘要。您可以在 context-window-utils.ts 中查看如何确定阈值。

成本考量

摘要利用了对话中现有的提示缓存，因此成本与任何其他工具调用大致相同。由于大多数输入令牌都已缓存，您主要支付的是摘要生成（输出令牌）的费用，使其非常划算。

使用检查点恢复上下文

您可以使用检查点来恢复摘要发生之前的任务状态。这意味着您永远不会真正丢失上下文 - 您始终可以回滚到对话的早期版本。

在摘要工具调用之前编辑消息将类似于检查点，允许您将对话恢复到该点。

下一代模型支持

自动压缩使用基于 LLM 的高级摘要功能，我们发现这对下一代模型效果显著更好。我们目前支持以下模型的此功能：

Claude 4 系列
Gemini 2.5 系列
GPT-5
Grok 4

当使用其他模型时，即使在设置中启用了自动压缩，Cline 也会自动回退到标准的基于规则的上下文截断方法。

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

工作原理

重要性

技术细节

成本考量

使用检查点恢复上下文

下一代模型支持

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

​工作原理

​重要性

​技术细节

​成本考量

​使用检查点恢复上下文

​下一代模型支持

工作原理

重要性

技术细节

成本考量

使用检查点恢复上下文

下一代模型支持