配额与速率限制
查阅 AIGCDesk API 的限制信息来源、上线前应确认的额度项,以及触发限制后的排查要点。
- AIGCDesk API 的限制不只来自单一阈值,常见还会同时受到 Token 限额、模型倍率、补全倍率和用户组倍率影响
- 不同模型、不同 Token 或不同用户组,限制策略可能不同
- 如果控制台没有直接展示数值,先确认这枚 Token 的额度、到期时间和模型限制
上线前至少确认这些项
Section titled “上线前至少确认这些项”- 每个 Token 的调用额度
- 每个模型的速率限制或并发限制
- 当前模型是否会受倍率或分组策略影响
- 超额后的处理方式,例如拒绝、限流或需要升级
- 监控口径,例如日志、告警和请求追踪方式
触发限制时优先关注
Section titled “触发限制时优先关注”- HTTP 状态码是否为
429 - 错误码或错误消息是否明确指向额度或速率限制
- 是否保留了
request_id - 问题是单个 Token、单个模型,还是整段流量同时受到影响
需要进一步排查时
Section titled “需要进一步排查时”- 如果问题表现为偶发失败、超时或退避重试,请继续查看 接入排查
- 如果控制台开放了 Token 用量或日志页,优先查看这些数据再继续排查