跳过主要内容
Baseten 提供按需的前沿模型 API,专为生产应用而非仅仅实验而设计。这些 API 基于 Baseten 推理堆栈构建,为来自 OpenAI、DeepSeek、Moonshot AI 和阿里巴巴云的领先开源模型提供优化的推理服务。 网站: https://www.baseten.co/products/model-apis/

获取 API 密钥

  1. 注册/登录: 访问 Baseten 并创建账户或登录。
  2. 导航到 API 密钥: 访问仪表板并进入 API 密钥部分。
  3. 创建密钥: 生成一个新的 API 密钥。给它一个描述性的名称(例如“Cline”)。
  4. 复制密钥: 立即复制 API 密钥并安全存储。

在 Cline 中配置

  1. 打开 Cline 设置: 单击 Cline 面板中的设置图标 (⚙️)。
  2. 选择提供商: 从“API 提供商”下拉列表中选择“Baseten”。
  3. 输入 API 密钥: 将您的 Baseten API 密钥粘贴到“Baseten API 密钥”字段中。
  4. 选择模型: 从“模型”下拉列表中选择您想要的模型。
重要提示:针对 Kimi K2 Thinking: 要使用 moonshotai/Kimi-K2-Thinking 模型,您必须在 Cline 设置中启用原生工具调用(实验性)。此设置允许 Cline 通过其原生工具处理器调用工具,并且是此推理模型正常运行所必需的。

支持的模型

Cline 支持 Baseten 模型 API 下的所有当前模型,包括:有关最新定价,请访问:https://www.baseten.co/products/model-apis/
  • moonshotai/Kimi-K2-Thinking (Moonshot AI) - 具有分步思维过程的增强推理能力(262K 上下文) - 每 1M token $0.60/$2.50
  • zai-org/GLM-4.6 (Z AI) - Z AI 提供的具有高级智能体、推理和编码能力的前沿开放模型(200k 上下文) - 每 1M token $0.60/$2.20
  • moonshotai/Kimi-K2-Instruct-0905 (Moonshot AI) - 9 月更新,能力增强(262K 上下文) - 每 1M token $0.60/$2.50
  • openai/gpt-oss-120b (OpenAI) - 120B MoE,具有强大的推理能力(128K 上下文) - 每 1M token $0.10/$0.50
  • Qwen/Qwen3-Coder-480B-A35B-Instruct - 高级编码和推理(262K 上下文) - 每 1M token $0.38/$1.53
  • Qwen/Qwen3-235B-A22B-Instruct-2507 - 数学和推理专家(262K 上下文) - 每 1M token $0.22/$0.80
  • deepseek-ai/DeepSeek-R1 - DeepSeek 的第一代推理模型(163K 上下文) - 每 1M token $2.55/$5.95
  • deepseek-ai/DeepSeek-R1-0528 - DeepSeek 推理模型的最新修订版(163K 上下文) - 每 1M token $2.55/$5.95
  • deepseek-ai/DeepSeek-V3.1 - 混合推理与高级工具调用(163K 上下文) - 每 1M token $0.50/$1.50
  • deepseek-ai/DeepSeek-V3-0324 - 快速通用型,增强推理能力(163K 上下文) - 每 1M token $0.77/$0.77
  • deepseek-ai/DeepSeek-V3.2 - 快速通用型,增强推理能力(163K 上下文) - 每 1M token $0.77/$0.77

生产优先的架构

Baseten 的模型 API 专为生产环境构建,具有以下几个主要优势

企业级可靠性

  • 四个九的正常运行时间(99.99%),通过主动-主动冗余实现
  • 云无关、多集群自动扩缩,实现持续可用性
  • 通过 SOC 2 Type II 认证HIPAA 合规,满足安全要求

优化的性能

  • 随 Baseten 推理堆栈提供的预优化模型
  • 最新一代 GPU 和多云基础设施
  • 超快推理,为生产工作负载进行自底向上优化

成本效益

  • 比封闭替代方案便宜 5-10 倍
  • 优化的多云基础设施,实现高效的资源利用
  • 透明定价,没有隐藏费用或速率限制意外

开发者体验

  • OpenAI 兼容 API - 只需更改一个 URL 即可迁移
  • 封闭模型的直接替代品,具有全面的可观察性和分析功能
  • 从模型 API 到专用部署的无缝扩展

特殊功能

函数调用与工具使用

所有 Baseten 模型都支持结构化输出、函数调用和工具使用,作为 Baseten 推理堆栈的一部分,使其成为智能体应用和编码工作流的理想选择。

提示和注意事项

  • 动态模型更新: Cline 自动从 Baseten 获取最新的模型列表,确保实时访问新发布的模型。
  • 多云容量管理 (MCM): Baseten 的多云基础设施确保了全球高可用性和低延迟。
  • 支持: Baseten 为生产部署提供专用支持,并可在您扩展时与您合作处理专用资源。

定价信息

当前定价具有极强的竞争力且透明。有关最新定价,请访问 Baseten 模型 API 页面。价格通常在每百万 token $0.10-$6.00 之间,这使得 Baseten 比许多封闭模型替代方案更具成本效益,同时提供了对最先进开源模型的访问。