上下文窗口指南

什么是上下文窗口？

上下文窗口是 AI 模型一次可以处理的最大文本量。可以将其视为模型的“工作记忆”，它决定了模型在生成响应时可以考虑多少对话和代码。

关键点：更大的上下文窗口允许模型一次性理解更多代码库，但这可能会增加成本和响应时间。

上下文窗口大小

快速参考

大小	Token 数	近似词数	用例
小	8K-32K	6,000-24,000	单个文件、快速修复
中	128K	~96,000	大多数编码项目
大	200K	~150,000	复杂代码库
特大	400K+	~300,000+	整个应用程序
巨大	1M+	~750,000+	多项目分析

模型上下文窗口

模型	上下文窗口	有效窗口*	备注
Claude Sonnet 4.5	1M tokens	~500K tokens	高上下文下的最佳质量
GPT-5	400K tokens	~300K tokens	三种模式影响性能
Gemini 2.5 Pro	1M+ tokens	~600K tokens	文档处理极佳
DeepSeek V3	128K tokens	~100K tokens	适用于大多数任务
Qwen3 Coder	256K tokens	~200K tokens	良好平衡

*有效窗口是指模型保持高质量的范围

高效管理上下文

计入上下文的内容

您当前的对话 - 聊天中的所有消息
文件内容 - 您共享或 Cline 读取的任何文件
工具输出 - 执行命令的结果
系统提示 - Cline 的指令（影响最小）

优化策略

1. 新功能从头开始

/new - Creates a new task with clean context

益处

可用最大上下文
没有不相关的历史记录
更好的模型专注度

2. 策略性使用 @ 提及

而不是包含整个文件

@filename.ts - 仅在需要时包含
使用搜索而不是读取大文件
引用特定函数而不是整个文件

3. 启用自动压缩

Cline 可以自动总结冗长的对话

设置 → 功能 → 自动压缩
保留重要上下文
减少 token 使用

上下文窗口警告

达到限制的迹象

警告标志	含义	解决方案
“上下文窗口超出”	达到硬性限制	开始新任务或启用自动压缩
响应变慢	模型在处理上下文时遇到困难	减少包含的文件
重复的建议	上下文碎片化	总结并从头开始
遗漏了最近的更改	上下文溢出	使用检查点来跟踪更改

按项目大小划分的最佳实践

小型项目（< 50 个文件）

任何模型都适用
自由包含相关文件
无需特殊优化

中型项目（50-500 个文件）

使用 128K+ 上下文模型
仅包含工作集文件
在功能之间清除上下文

大型项目（500+ 个文件）

使用 200K+ 上下文模型
专注于特定模块
使用搜索而不是读取许多文件
将工作分解为更小的任务

高级上下文管理

计划/执行模式优化

利用计划/执行模式来优化上下文使用

计划模式：使用较小的上下文进行讨论
执行模式：包含必要的实现文件

配置

Plan Mode: DeepSeek V3 (128K) - Lower cost planning
Act Mode: Claude Sonnet (1M) - Maximum context for coding

上下文修剪策略

时间修剪：移除旧对话部分
语义修剪：只保留相关代码段
分层修剪：保持高层结构，修剪细节

Token 计数技巧

大致估算

1 token ≈ 0.75 个词
1 token ≈ 4 个字符
100 行代码 ≈ 500-1000 tokens

文件大小指南

文件类型	每 KB token 数
代码	~250-400
JSON	~300-500
Markdown	~200-300
纯文本	~200-250

上下文窗口常见问题解答

问：为什么对话太长时响应会变差？

答：模型在上下文过多时可能会失去焦点。“有效窗口”通常是宣传限制的 50-70%。

问：我应该使用最大的上下文窗口吗？

答：不一定。更大的上下文会增加成本并可能降低响应质量。根据任务大小匹配上下文。

问：如何知道我使用了多少上下文？

答：Cline 在界面中显示 token 使用量。注意上下文仪表接近限制。

问：超出上下文限制会发生什么？

答：Cline 会执行以下操作之一：

自动压缩对话（如果启用）
显示错误并建议开始新任务
截断旧消息（并发出警告）

按用例推荐

用例	推荐上下文	模型建议
快速修复	32K-128K	DeepSeek V3
功能开发	128K-200K	Qwen3 Coder
大型重构	400K+	Claude Sonnet 4.5
代码审查	200K-400K	GPT-5
文档	128K	任何预算模型

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

什么是上下文窗口？

上下文窗口大小

快速参考

模型上下文窗口

高效管理上下文

计入上下文的内容

优化策略

1. 新功能从头开始

2. 策略性使用 @ 提及

3. 启用自动压缩

上下文窗口警告

达到限制的迹象

按项目大小划分的最佳实践

小型项目（< 50 个文件）

中型项目（50-500 个文件）

大型项目（500+ 个文件）

高级上下文管理

计划/执行模式优化

上下文修剪策略

Token 计数技巧

大致估算

文件大小指南

上下文窗口常见问题解答

问：为什么对话太长时响应会变差？

问：我应该使用最大的上下文窗口吗？

问：如何知道我使用了多少上下文？

问：超出上下文限制会发生什么？

按用例推荐

简介

入门

最佳实践

CLI

功能

模型与提供商配置

MCP 集成

Cline 工具参考

参考

​什么是上下文窗口？

​上下文窗口大小

​快速参考

​模型上下文窗口

​高效管理上下文

​计入上下文的内容

​优化策略

​1. 新功能从头开始

​2. 策略性使用 @ 提及

​3. 启用自动压缩

​上下文窗口警告

​达到限制的迹象

​按项目大小划分的最佳实践

​小型项目（< 50 个文件）

​中型项目（50-500 个文件）

​大型项目（500+ 个文件）

​高级上下文管理

​计划/执行模式优化

​上下文修剪策略

​Token 计数技巧

​大致估算

​文件大小指南

​上下文窗口常见问题解答

​问：为什么对话太长时响应会变差？

​问：我应该使用最大的上下文窗口吗？

​问：如何知道我使用了多少上下文？

​问：超出上下文限制会发生什么？

​按用例推荐

什么是上下文窗口？

上下文窗口大小

快速参考

模型上下文窗口

高效管理上下文

计入上下文的内容

优化策略

1. 新功能从头开始

2. 策略性使用 @ 提及

3. 启用自动压缩

上下文窗口警告

达到限制的迹象

按项目大小划分的最佳实践

小型项目（< 50 个文件）

中型项目（50-500 个文件）

大型项目（500+ 个文件）

高级上下文管理

计划/执行模式优化

上下文修剪策略

Token 计数技巧

大致估算

文件大小指南

上下文窗口常见问题解答

问：为什么对话太长时响应会变差？

问：我应该使用最大的上下文窗口吗？

问：如何知道我使用了多少上下文？

问：超出上下文限制会发生什么？

按用例推荐