Limites de taxa
Limites por workspace e por operação, headers e comportamento de retry para fluxos de trabalho de agente e chamadas HTTP.
O UnifAPI aplica duas camadas de limitação de taxa: um limite por workspace que suaviza o tráfego em todas as Skills e chamadas de API, e um limite por operação que protege cada origem de dados públicos.
Headers
Toda resposta — 2xx ou 429 — carrega os headers padrão:
| Header | Significado |
|---|---|
X-RateLimit-Limit | Requests permitidos na janela atual |
X-RateLimit-Remaining | Requests restantes na janela atual |
X-RateLimit-Reset | Timestamp Unix (segundos) de quando a janela reinicia |
Retry-After | Segundos para esperar antes de tentar novamente (429 apenas) |
Quando se aplicam tanto um limite de workspace quanto um de endpoint, os headers reportam o que for mais restritivo.
Padrões
| Plano | Limite do workspace | Limite por endpoint |
|---|---|---|
| Free | 60 req/min | Source-aware |
| Pay-as-you-go | 600 req/min | Source-aware |
| Enterprise | Personalizado | Personalizado |
Lidando com 429
async function call(url: string, init: RequestInit, attempt = 0): Promise<Response> {
const res = await fetch(url, init);
if (res.status !== 429 || attempt >= 5) return res;
const retryAfter = Number(res.headers.get("Retry-After") ?? 1);
await new Promise((r) => setTimeout(r, retryAfter * 1000));
return call(url, init, attempt + 1);
}Duas regras para seguir sempre:
- Respeite o
Retry-After. O UnifAPI retorna o tempo de espera que a operação precisa — adivinhar geralmente piora as coisas. - Faça backoff em 429s repetidos. Se uma Skill atinge o limite várias vezes seguidas, restrinja a query, reduza a concorrência ou aumente o limite do workspace.
Comportamento de burst
Os limites são token-bucket: um workspace que esteve ocioso por um minuto pode brevemente ultrapassar seu limite de regime permanente. Não confie nisso para tráfego de produção — projete para a taxa de regime permanente.
Pedindo mais
Precisa de um limite mais alto? Envie um e-mail para support@unifapi.com com o ID do seu workspace, a Skill ou operação que você está executando e uma estimativa aproximada de QPS.