跳过主要内容Baseten 提供按需的前沿模型 API,专为生产应用而非仅仅实验而设计。这些 API 基于 Baseten 推理堆栈构建,为来自 OpenAI、DeepSeek、Moonshot AI 和阿里巴巴云的领先开源模型提供优化的推理服务。 网站: https://www.baseten.co/products/model-apis/获取 API 密钥
- 注册/登录: 访问 Baseten 并创建账户或登录。
- 导航到 API 密钥: 访问仪表板并进入 API 密钥部分。
- 创建密钥: 生成一个新的 API 密钥。给它一个描述性的名称(例如“Cline”)。
- 复制密钥: 立即复制 API 密钥并安全存储。
在 Cline 中配置
- 打开 Cline 设置: 单击 Cline 面板中的设置图标 (⚙️)。
- 选择提供商: 从“API 提供商”下拉列表中选择“Baseten”。
- 输入 API 密钥: 将您的 Baseten API 密钥粘贴到“Baseten API 密钥”字段中。
- 选择模型: 从“模型”下拉列表中选择您想要的模型。
重要提示:针对 Kimi K2 Thinking: 要使用 moonshotai/Kimi-K2-Thinking 模型,您必须在 Cline 设置中启用原生工具调用(实验性)。此设置允许 Cline 通过其原生工具处理器调用工具,并且是此推理模型正常运行所必需的。
支持的模型
Cline 支持 Baseten 模型 API 下的所有当前模型,包括:有关最新定价,请访问:https://www.baseten.co/products/model-apis/
moonshotai/Kimi-K2-Thinking (Moonshot AI) - 具有分步思维过程的增强推理能力(262K 上下文) - 每 1M token $0.60/$2.50
zai-org/GLM-4.6 (Z AI) - Z AI 提供的具有高级智能体、推理和编码能力的前沿开放模型(200k 上下文) - 每 1M token $0.60/$2.20
moonshotai/Kimi-K2-Instruct-0905 (Moonshot AI) - 9 月更新,能力增强(262K 上下文) - 每 1M token $0.60/$2.50
openai/gpt-oss-120b (OpenAI) - 120B MoE,具有强大的推理能力(128K 上下文) - 每 1M token $0.10/$0.50
Qwen/Qwen3-Coder-480B-A35B-Instruct - 高级编码和推理(262K 上下文) - 每 1M token $0.38/$1.53
Qwen/Qwen3-235B-A22B-Instruct-2507 - 数学和推理专家(262K 上下文) - 每 1M token $0.22/$0.80
deepseek-ai/DeepSeek-R1 - DeepSeek 的第一代推理模型(163K 上下文) - 每 1M token $2.55/$5.95
deepseek-ai/DeepSeek-R1-0528 - DeepSeek 推理模型的最新修订版(163K 上下文) - 每 1M token $2.55/$5.95
deepseek-ai/DeepSeek-V3.1 - 混合推理与高级工具调用(163K 上下文) - 每 1M token $0.50/$1.50
deepseek-ai/DeepSeek-V3-0324 - 快速通用型,增强推理能力(163K 上下文) - 每 1M token $0.77/$0.77
deepseek-ai/DeepSeek-V3.2 - 快速通用型,增强推理能力(163K 上下文) - 每 1M token $0.77/$0.77
生产优先的架构
Baseten 的模型 API 专为生产环境构建,具有以下几个主要优势
企业级可靠性
- 四个九的正常运行时间(99.99%),通过主动-主动冗余实现
- 云无关、多集群自动扩缩,实现持续可用性
- 通过 SOC 2 Type II 认证和 HIPAA 合规,满足安全要求
- 随 Baseten 推理堆栈提供的预优化模型
- 最新一代 GPU 和多云基础设施
- 超快推理,为生产工作负载进行自底向上优化
成本效益
- 比封闭替代方案便宜 5-10 倍
- 优化的多云基础设施,实现高效的资源利用
- 透明定价,没有隐藏费用或速率限制意外
开发者体验
- OpenAI 兼容 API - 只需更改一个 URL 即可迁移
- 封闭模型的直接替代品,具有全面的可观察性和分析功能
- 从模型 API 到专用部署的无缝扩展
特殊功能
所有 Baseten 模型都支持结构化输出、函数调用和工具使用,作为 Baseten 推理堆栈的一部分,使其成为智能体应用和编码工作流的理想选择。
提示和注意事项
- 动态模型更新: Cline 自动从 Baseten 获取最新的模型列表,确保实时访问新发布的模型。
- 多云容量管理 (MCM): Baseten 的多云基础设施确保了全球高可用性和低延迟。
- 支持: Baseten 为生产部署提供专用支持,并可在您扩展时与您合作处理专用资源。
当前定价具有极强的竞争力且透明。有关最新定价,请访问 Baseten 模型 API 页面。价格通常在每百万 token $0.10-$6.00 之间,这使得 Baseten 比许多封闭模型替代方案更具成本效益,同时提供了对最先进开源模型的访问。