跳过主要内容使用 Cline 设置 LM Studio
使用 LM Studio 和 Cline 在本地运行 AI 模型。
先决条件
- 支持 AVX2 的 Windows、macOS 或 Linux 计算机
- 在 VS Code 中安装了 Cline
设置步骤
1. 安装 LM Studio
2. 启动 LM Studio
- 打开已安装的应用程序
- 您将在左侧看到四个选项卡:Chat(聊天)、Developer(开发者)(您将在此处启动服务器)、My Models(我的模型)(存储您下载的模型)、Discover(发现)(添加新模型)
3. 下载模型
- 浏览“Discover”页面
- 选择并下载您喜欢的模型
- 等待下载完成
4. 启动服务器
- 导航到“Developer”选项卡
- 将服务器开关切换为“Running”(运行中)
- 注意:服务器将在
https://:1234 运行
- 打开 VS Code
- 点击 Cline 设置图标
- 选择“LM Studio”作为 API 提供商
- 从可用选项中选择您的模型
推荐的模型和设置
为了获得最佳的 Cline 体验,请使用 Qwen3 Coder 30B A3B Instruct。该模型具有强大的编码性能和可靠的工具使用能力。
关键设置
在“Developer”选项卡中加载模型后,配置这些设置
- 上下文长度:设置为 262,144(模型的最大值)
- KV 缓存量化:保持未选中状态(对保持一致性能至关重要)
- Flash Attention:如果可用,请启用(提高性能)
量化指南
根据您的 RAM 选择量化
- 32GB RAM:使用 4 位量化(下载大小约 17GB)
- 64GB RAM:使用 8 位量化(下载大小约 32GB)以获得更好的质量
- 128GB+ RAM:考虑使用全精度或更大的模型
- Mac (Apple Silicon):使用 MLX 格式以获得优化性能
- Windows/Linux:使用 GGUF 格式
启用紧凑型提示
为了获得本地模型的最佳性能,请在 Cline 设置中启用紧凑型提示。这会将提示大小减少 90%,同时保持核心功能。 导航到 Cline 设置 → Features(功能) → Use Compact Prompt(使用紧凑型提示)并将其打开。重要提示
- 在使用 Cline 之前启动 LM Studio
- 保持 LM Studio 在后台运行
- 首次下载模型可能需要几分钟,具体取决于大小
- 下载后模型存储在本地
故障排除
- 如果 Cline 无法连接到 LM Studio
- 验证 LM Studio 服务器是否正在运行(检查 Developer 选项卡)
- 确保已加载模型
- 检查您的系统是否满足硬件要求