Skip to content

路由与回退

汕拓智算在一套兼容端点背后接入 50+ 上游通道。你选模型,网关选通道:按成本与可用性自动选路,上游故障时自动回退,每一次调用都带一个 trace id 便于追踪。本页说明哪些由你控制、哪些由网关自动完成。

你控制什么,网关控制什么

边界很简单:

  • 你控制:用哪个密钥(决定分组与协议面)、调哪个模型、请求参数。模型 ID 以 GET /v1/models 的返回为准。
  • 网关控制:用哪条上游通道承载这次调用、失败时回退到哪条通道。这些对调用方透明,你的请求与响应格式不变。

换言之,你表达"我要哪个模型",网关负责"用哪条通道把它跑出来"。

按成本与可用性自动选路

同一个模型可能由多条上游通道提供。每次请求到来时,网关在当前可用的通道中选路,综合考虑成本与可用性。你不需要、也无法手动指定具体通道:指定模型即可,选路由网关完成。

TIP

不确定某个模型的确切 model ID?调用 GET /v1/models,以服务端返回为准。详见模型

失败自动回退

当一条上游通道故障或超时,网关会自动回退到承载同一模型的另一条可用通道,调用方无感知。

  • 回退在网关侧发生,你的请求格式不变。
  • 失败与超时的请求不计费,见计费
  • 若所有可用通道都无法完成,网关会向你返回错误。错误结构、状态码与重试建议见限额与错误

回退能提升稳定性,但不是无限重试。对 4295xx,客户端仍应按退避策略重试,具体见限额与错误

逐次可追溯:trace id

每一次调用都带一个 trace id。它把这次请求与其在账本中的计量、对账记录关联起来,便于排查与核对用量。配合公开的通道状态,你既能看到平台整体的通道健康,也能逐次追溯自己的调用。

通道状态公开

通道与健康状态对外公开可查。当你遇到某个模型不稳定时,可对照公开的通道状态判断是平台侧的上游波动,还是你这一侧的问题(例如密钥分组平台不匹配,见限额与错误)。

下一步

  • 模型 — 在售模型一览,以及如何用 GET /v1/models 取确切 ID。
  • 限额与错误 — 错误结构、状态码与重试建议。
  • 计费 — 按次计费、失败不计费、统一账本。