Os modelos processam texto dividindo-o em unidades menores chamadas tokens. Um token pode ser:
Em média, 1.000 tokens ≈ 750 palavras.
Esses valores são aproximados e servem apenas para dar uma ideia geral dos custos de uso. Cada modelo utiliza seu próprio tokenizador e divide o texto de forma diferente.
Os tokens são cobrados tanto na entrada quanto na saída. Por exemplo, se sua solicitação contém 20 tokens e o modelo gera uma resposta de 30 tokens, um total de 50 tokens será descontado da sua cota.
A quantidade ideal de tokens para o seu agente só pode ser determinada durante o uso real, monitorando o consumo.