LM Studio - Cline 文档

使用 Cline 设置 LM Studio
先决条件
设置步骤
1. 安装 LM Studio
2. 启动 LM Studio
3. 下载模型
4. 启动服务器
5. 配置 Cline
推荐的模型和设置
关键设置
量化指南
模型格式
启用紧凑型提示
重要提示
故障排除

使用 Cline 设置 LM Studio

使用 LM Studio 和 Cline 在本地运行 AI 模型。

先决条件

支持 AVX2 的 Windows、macOS 或 Linux 计算机
在 VS Code 中安装了 Cline

设置步骤

1. 安装 LM Studio

访问 lmstudio.ai
为您的操作系统下载并安装

LM Studio download page

2. 启动 LM Studio

打开已安装的应用程序
您将在左侧看到四个选项卡：Chat（聊天）、Developer（开发者）（您将在此处启动服务器）、My Models（我的模型）（存储您下载的模型）、Discover（发现）（添加新模型）

LM Studio interface overview

3. 下载模型

浏览“Discover”页面
选择并下载您喜欢的模型
等待下载完成

Downloading a model in LM Studio

4. 启动服务器

导航到“Developer”选项卡
将服务器开关切换为“Running”（运行中）
注意：服务器将在 https://:1234 运行

Starting the LM Studio server

5. 配置 Cline

打开 VS Code
点击 Cline 设置图标
选择“LM Studio”作为 API 提供商
从可用选项中选择您的模型

Configuring Cline with LM Studio

推荐的模型和设置

为了获得最佳的 Cline 体验，请使用 Qwen3 Coder 30B A3B Instruct。该模型具有强大的编码性能和可靠的工具使用能力。

关键设置

在“Developer”选项卡中加载模型后，配置这些设置

上下文长度：设置为 262,144（模型的最大值）
KV 缓存量化：保持未选中状态（对保持一致性能至关重要）
Flash Attention：如果可用，请启用（提高性能）

量化指南

根据您的 RAM 选择量化

32GB RAM：使用 4 位量化（下载大小约 17GB）
64GB RAM：使用 8 位量化（下载大小约 32GB）以获得更好的质量
128GB+ RAM：考虑使用全精度或更大的模型

模型格式

Mac (Apple Silicon)：使用 MLX 格式以获得优化性能
Windows/Linux：使用 GGUF 格式

启用紧凑型提示

为了获得本地模型的最佳性能，请在 Cline 设置中启用紧凑型提示。这会将提示大小减少 90%，同时保持核心功能。导航到 Cline 设置 → Features（功能） → Use Compact Prompt（使用紧凑型提示）并将其打开。

重要提示

在使用 Cline 之前启动 LM Studio
保持 LM Studio 在后台运行
首次下载模型可能需要几分钟，具体取决于大小
下载后模型存储在本地

故障排除

如果 Cline 无法连接到 LM Studio
验证 LM Studio 服务器是否正在运行（检查 Developer 选项卡）
确保已加载模型
检查您的系统是否满足硬件要求

⌘I