概览
GCP Vertex AI:一项完全托管的服务,通过 Google Cloud 提供对领先生成式 AI 模型的访问权限,例如 Anthropic 的 Claude 3.5 Sonnet v2。
了解有关 GCP Vertex AI 的更多信息。 本指南专为拥有成熟 GCP 环境(利用 IAM 角色、服务账号和资源管理最佳实践)的组织量身定制,以确保安全合规的使用。
步骤 1:准备您的 GCP 环境
1.1 创建或使用 GCP 项目
- 登录 GCP Console
Google Cloud Console - 选择或创建项目
使用现有项目或创建一个专用于 Vertex AI 的新项目。
1.2 设置 IAM 权限和服务账号
-
分配必需的角色
- 授予您的用户(或服务账号) Vertex AI User 角色 (
roles/aiplatform.user) - 对于服务账号,还需要附加 Vertex AI Service Agent 角色 (
roles/aiplatform.serviceAgent) 以启用某些操作 - 根据需要考虑其他预定义角色
- Vertex AI Platform Express Admin
- Vertex AI Platform Express User
- Vertex AI Migration Service User
- 授予您的用户(或服务账号) Vertex AI User 角色 (
-
跨项目资源访问
- 对于不同项目中的 BigQuery 表,分配 BigQuery Data Viewer 角色
- 对于不同项目中的 Cloud Storage 存储桶,分配 Storage Object Viewer 角色
- 对于外部数据源,请参阅 GCP Vertex AI 访问控制文档
第 2 步:验证区域和模型访问权限
2.1 选择并确认区域
Vertex AI 支持多个区域。选择一个符合您的延迟、合规性和容量需求的区域。示例包括:- us-east5(俄亥俄州哥伦布)
- us-central1(爱荷华州)
- europe-west1(比利时)
- europe-west4(荷兰)
- asia-southeast1(新加坡)
- global(全球)
2.2 启用 Claude 3.5 Sonnet v2 模型
- 打开 Vertex AI 模型库
在 Cloud Console 中,导航到 Vertex AI → 模型库(Model Garden) - 启用 Claude 3.5 Sonnet v2
找到 Claude 3.5 Sonnet v2 的模型卡片并点击启用(Enable)
第 3 步:配置 Cline VS Code 扩展
3.1 安装并打开 Cline
- 下载 VS Code
下载 Visual Studio Code - 安装 Cline 扩展
- 打开 VS Code
- 导航到扩展市场(Ctrl+Shift+X 或 Cmd+Shift+X)
- 搜索 Cline 并安装该扩展

3.2 配置 Cline 设置
- 打开 Cline 设置
点击 Cline 扩展中的设置 ⚙️ 图标 - 设置 API 提供商
从 API 提供商下拉列表中选择 GCP Vertex AI - 输入您的 Google Cloud 项目 ID
提供您之前设置的项目 ID - 选择区域
选择一个受支持的区域(例如us-east5) - 选择模型
从可用列表中选择 Claude 3.5 Sonnet v2 - 保存并测试
保存设置并发送一个简单的提示进行测试(例如,“生成一个 Python 函数来检查一个数字是否为素数。”)
步骤 4:身份验证和凭证设置
选项 A:使用您的 Google 账号(用户凭证)
-
安装 Google Cloud CLI
遵循安装指南 -
初始化并进行身份验证
- 使用您的 Google 账号设置应用程序默认凭证 (ADC)
-
重启 VS Code
确保 VS Code 已重启,以便 Cline 扩展获取新的凭证
选项 B:使用服务账号(JSON 密钥)
-
创建一个服务账号
- 在 GCP Console 中,导航到 IAM & Admin > 服务账号(Service Accounts)
- 创建一个新的服务账号(例如,“vertex-ai-client”)
-
分配角色
- 附加 Vertex AI User (
roles/aiplatform.user) - 附加 Vertex AI Service Agent (
roles/aiplatform.serviceAgent) - 根据需要可选地添加其他角色
- 附加 Vertex AI User (
-
生成 JSON 密钥
- 在“服务账号”部分,管理您的服务账号的密钥并下载 JSON 密钥
-
设置环境变量
- 这会指示 Google Cloud 客户端库(和 Cline)使用此密钥
-
重启 VS Code
从设置了GOOGLE_APPLICATION_CREDENTIALS变量的终端启动 VS Code
步骤 5:安全、监控和最佳实践
5.1 实施最小权限原则
- 最小权限原则
仅授予必要的最低权限。自定义角色可以提供比广泛预定义角色更精细的控制 - 最佳实践
请参阅 GCP IAM 最佳实践
5.2 管理资源访问
- 项目级与资源级访问
可以在两个级别管理访问权限。请注意,资源级权限(例如 BigQuery 或 Cloud Storage)是项目级策略的补充,但不会覆盖项目级策略
5.3 监控使用情况和配额
-
模型可观测性仪表板
- 在 Vertex AI Console 中,导航到模型可观测性(Model Observability)仪表板
- 监控请求吞吐量、延迟和错误率(包括 429 配额错误)等指标
-
配额管理
- 如果遇到 429 错误,请检查 IAM & Admin > 配额(Quotas)页面
- 如有必要,申请增加配额
了解有关 GCP Vertex AI 配额的更多信息
5.4 服务代理和跨项目注意事项
-
服务代理
注意不同的服务代理- Vertex AI Service Agent
- Vertex AI RAG Data Service Agent
- Vertex AI Custom Code Service Agent
- Vertex AI Extension Service Agent
-
跨项目访问
对于其他项目中的资源(例如 BigQuery、Cloud Storage),确保分配了适当的角色(BigQuery Data Viewer、Storage Object Viewer)
结论
通过遵循这些步骤,您的企业团队可以安全地将 GCP Vertex AI 与 Cline VS Code 扩展集成,以利用 Claude 3.5 Sonnet v2 的强大功能- 准备您的 GCP 环境
创建或使用项目,配置具有最小权限的 IAM,并确保附加必要的角色(包括 Vertex AI Service Agent 角色) - 验证区域和模型访问
确认您选择的区域支持 Claude 3.5 Sonnet v2 并且该模型已启用 - 在 VS Code 中配置 Cline
安装 Cline,输入您的项目 ID,选择适当的区域,然后选择模型 - 设置身份验证
使用用户凭证(通过gcloud auth application-default login)或带有 JSON 密钥的服务账号 - 实施安全和监控
遵守 IAM 最佳实践,仔细管理资源访问,并使用模型可观测性仪表板监控使用情况
祝您编码愉快! 本指南将随着 GCP Vertex AI 和 Cline 的发展而更新。请始终参考最新文档以了解当前实践。

