跳过主要内容

什么是上下文窗口?

上下文窗口是 AI 模型一次可以处理的最大文本量。可以将其视为模型的“工作记忆”,它决定了模型在生成响应时可以考虑多少对话和代码。
关键点:更大的上下文窗口允许模型一次性理解更多代码库,但这可能会增加成本和响应时间。

上下文窗口大小

快速参考

大小Token 数近似词数用例
8K-32K6,000-24,000单个文件、快速修复
128K~96,000大多数编码项目
200K~150,000复杂代码库
特大400K+~300,000+整个应用程序
巨大1M+~750,000+多项目分析

模型上下文窗口

模型上下文窗口有效窗口*备注
Claude Sonnet 4.51M tokens~500K tokens高上下文下的最佳质量
GPT-5400K tokens~300K tokens三种模式影响性能
Gemini 2.5 Pro1M+ tokens~600K tokens文档处理极佳
DeepSeek V3128K tokens~100K tokens适用于大多数任务
Qwen3 Coder256K tokens~200K tokens良好平衡
*有效窗口是指模型保持高质量的范围

高效管理上下文

计入上下文的内容

  1. 您当前的对话 - 聊天中的所有消息
  2. 文件内容 - 您共享或 Cline 读取的任何文件
  3. 工具输出 - 执行命令的结果
  4. 系统提示 - Cline 的指令(影响最小)

优化策略

1. 新功能从头开始

/new - Creates a new task with clean context
益处
  • 可用最大上下文
  • 没有不相关的历史记录
  • 更好的模型专注度

2. 策略性使用 @ 提及

而不是包含整个文件
  • @filename.ts - 仅在需要时包含
  • 使用搜索而不是读取大文件
  • 引用特定函数而不是整个文件

3. 启用自动压缩

Cline 可以自动总结冗长的对话
  • 设置 → 功能 → 自动压缩
  • 保留重要上下文
  • 减少 token 使用

上下文窗口警告

达到限制的迹象

警告标志含义解决方案
“上下文窗口超出”达到硬性限制开始新任务或启用自动压缩
响应变慢模型在处理上下文时遇到困难减少包含的文件
重复的建议上下文碎片化总结并从头开始
遗漏了最近的更改上下文溢出使用检查点来跟踪更改

按项目大小划分的最佳实践

小型项目(< 50 个文件)

  • 任何模型都适用
  • 自由包含相关文件
  • 无需特殊优化

中型项目(50-500 个文件)

  • 使用 128K+ 上下文模型
  • 仅包含工作集文件
  • 在功能之间清除上下文

大型项目(500+ 个文件)

  • 使用 200K+ 上下文模型
  • 专注于特定模块
  • 使用搜索而不是读取许多文件
  • 将工作分解为更小的任务

高级上下文管理

计划/执行模式优化

利用计划/执行模式来优化上下文使用
  • 计划模式:使用较小的上下文进行讨论
  • 执行模式:包含必要的实现文件
配置
Plan Mode: DeepSeek V3 (128K) - Lower cost planning
Act Mode: Claude Sonnet (1M) - Maximum context for coding

上下文修剪策略

  1. 时间修剪:移除旧对话部分
  2. 语义修剪:只保留相关代码段
  3. 分层修剪:保持高层结构,修剪细节

Token 计数技巧

大致估算

  • 1 token ≈ 0.75 个词
  • 1 token ≈ 4 个字符
  • 100 行代码 ≈ 500-1000 tokens

文件大小指南

文件类型每 KB token 数
代码~250-400
JSON~300-500
Markdown~200-300
纯文本~200-250

上下文窗口常见问题解答

问:为什么对话太长时响应会变差?

答:模型在上下文过多时可能会失去焦点。“有效窗口”通常是宣传限制的 50-70%。

问:我应该使用最大的上下文窗口吗?

答:不一定。更大的上下文会增加成本并可能降低响应质量。根据任务大小匹配上下文。

问:如何知道我使用了多少上下文?

答:Cline 在界面中显示 token 使用量。注意上下文仪表接近限制。

问:超出上下文限制会发生什么?

答:Cline 会执行以下操作之一:
  • 自动压缩对话(如果启用)
  • 显示错误并建议开始新任务
  • 截断旧消息(并发出警告)

按用例推荐

用例推荐上下文模型建议
快速修复32K-128KDeepSeek V3
功能开发128K-200KQwen3 Coder
大型重构400K+Claude Sonnet 4.5
代码审查200K-400KGPT-5
文档128K任何预算模型