路由与回退
汕拓智算在一套兼容端点背后接入 50+ 上游通道。你选模型,网关选通道:按成本与可用性自动选路,上游故障时自动回退,每一次调用都带一个 trace id 便于追踪。本页说明哪些由你控制、哪些由网关自动完成。
你控制什么,网关控制什么
边界很简单:
- 你控制:用哪个密钥(决定分组与协议面)、调哪个模型、请求参数。模型 ID 以
GET /v1/models的返回为准。 - 网关控制:用哪条上游通道承载这次调用、失败时回退到哪条通道。这些对调用方透明,你的请求与响应格式不变。
换言之,你表达"我要哪个模型",网关负责"用哪条通道把它跑出来"。
按成本与可用性自动选路
同一个模型可能由多条上游通道提供。每次请求到来时,网关在当前可用的通道中选路,综合考虑成本与可用性。你不需要、也无法手动指定具体通道:指定模型即可,选路由网关完成。
TIP
不确定某个模型的确切 model ID?调用 GET /v1/models,以服务端返回为准。详见模型。
失败自动回退
当一条上游通道故障或超时,网关会自动回退到承载同一模型的另一条可用通道,调用方无感知。
回退能提升稳定性,但不是无限重试。对 429 与 5xx,客户端仍应按退避策略重试,具体见限额与错误。
逐次可追溯:trace id
每一次调用都带一个 trace id。它把这次请求与其在账本中的计量、对账记录关联起来,便于排查与核对用量。配合公开的通道状态,你既能看到平台整体的通道健康,也能逐次追溯自己的调用。
通道状态公开
通道与健康状态对外公开可查。当你遇到某个模型不稳定时,可对照公开的通道状态判断是平台侧的上游波动,还是你这一侧的问题(例如密钥分组平台不匹配,见限额与错误)。
