跳转到内容
正在加载搜索…

配额与速率限制

查阅 AIGCDesk API 的限制信息来源、上线前应确认的额度项,以及触发限制后的排查要点。

  • AIGCDesk API 的限制不只来自单一阈值,常见还会同时受到 Token 限额、模型倍率、补全倍率和用户组倍率影响
  • 不同模型、不同 Token 或不同用户组,限制策略可能不同
  • 如果控制台没有直接展示数值,先确认这枚 Token 的额度、到期时间和模型限制
  • 每个 Token 的调用额度
  • 每个模型的速率限制或并发限制
  • 当前模型是否会受倍率或分组策略影响
  • 超额后的处理方式,例如拒绝、限流或需要升级
  • 监控口径,例如日志、告警和请求追踪方式
  • HTTP 状态码是否为 429
  • 错误码或错误消息是否明确指向额度或速率限制
  • 是否保留了 request_id
  • 问题是单个 Token、单个模型,还是整段流量同时受到影响
  • 如果问题表现为偶发失败、超时或退避重试,请继续查看 接入排查
  • 如果控制台开放了 Token 用量或日志页,优先查看这些数据再继续排查