Agentes de IA utilizam modelos de linguagem de grande porte e uma base de conhecimento. Esta seção descreve os modelos disponíveis, os preços e como os tokens são contabilizados.
Oferecemos acesso aos seguintes modelos de linguagem de grande porte:
|
Provider |
Modelo |
Raciocínio |
|
OpenAI |
GPT-5.1 |
✅ |
|
OpenAI |
GPT-5.2 |
✅ |
|
OpenAI |
GPT-5.3 Codex |
✅ |
|
OpenAI |
GPT-5.4 |
✅ |
|
DeepSeek |
DeepSeek v3.2 |
✅ |
|
xAI |
Grok 4.1 Fast |
✅ |
|
xAI |
Grok 4.1 Fast |
❌ |
|
Anthropic |
Claude Haiku 4.5 |
✅ |
|
Anthropic |
Claude Opus 4.6 |
✅ |
|
Anthropic |
Claude Sonnet 4.6 |
✅ |
|
Google AI |
Gemini 2.5 Flash Lite |
❌ |
|
Google AI |
Gemini 3 Flash Preview |
✅ |
|
Google AI |
Gemini 3.1 Pro Preview |
✅ |
|
Google AI |
Gemini 3.1 Flash Lite Preview |
✅ |
|
Qwen |
Qwen 3.5 Flash |
❌ |
|
Qwen |
Qwen 3.5 Flash |
✅ |
|
Qwen |
Qwen 3.5 Plus |
❌ |
|
Qwen |
Qwen 3.5 Plus |
✅ |
|
Qwen |
Qwen 3 Max |
❌ |
Os modelos processam texto dividindo-o em unidades menores chamadas tokens. Um token pode ser:
Em média, 1.000 tokens ≈ 750 palavras.
Esses valores são aproximados e servem apenas para dar uma ideia geral dos custos de uso. Cada modelo utiliza seu próprio tokenizador e divide o texto de forma diferente.
Os tokens são cobrados tanto na entrada quanto na saída. Por exemplo, se sua solicitação contém 20 tokens e o modelo gera uma resposta de 30 tokens, um total de 50 tokens será descontado da sua cota.
Se um modelo exibe um ícone de cérebro, isso significa que ele oferece suporte ao modo de raciocínio.
Nesse modo, o modelo gera etapas intermediárias de raciocínio antes de produzir a resposta final. Ele faz perguntas de esclarecimento para si mesmo e responde internamente. Isso ajuda a gerar respostas mais precisas e bem estruturadas, especialmente para tarefas complexas.
Cada etapa de raciocínio exige texto adicional de entrada e saída, o que aumenta o consumo de tokens.
O modo de raciocínio não pode ser desativado.
Os agentes de IA oferecem dois tipos de cobrança:
Os preços de cada modelo estão disponíveis no painel de controle ao criar um agente.
A taxa do plano é cobrada uma vez quando o agente é criado ou quando o plano é alterado. No mês seguinte, o plano é renovado com uma nova cobrança única. Tokens não utilizados no mês atual não são acumulados para o próximo período.
A quantidade ideal de tokens para o seu agente só pode ser determinada durante o uso real, monitorando o consumo.
Ao começar, recomendamos escolher o menor plano adequado e aumentá-lo posteriormente, se necessário. Não é possível fazer downgrade do plano.
Se você precisar de mais tokens, mas o próximo nível de plano for grande demais, ou se precisar de tokens adicionais apenas temporariamente, você pode comprar pacotes adicionais de tokens no painel de controle em vez de alterar o plano.
Você pode configurar a quantidade de tokens em incrementos de 250.000. O pacote permanece válido apenas até o final do período de cobrança atual; você pode verificar a data de renovação em Faturamento → Histórico de faturamento.
A taxa do pacote é cobrada uma única vez. Seu plano não é alterado, e a taxa padrão do plano será cobrada novamente no próximo mês.
O custo de uma base de conhecimento é composto por dois elementos:
Ao criar o banco de dados, escolha a menor configuração adequada. Você pode aumentá-la posteriormente, se necessário, mas não é possível fazer downgrade.
Ao criar uma base de conhecimento com a configuração mínima:
Se necessário, você pode adicionar tokens ao custo de $0.75 por 1.000.000 de tokens clicando em Adicionar tokens no painel (Dashboard) da base de conhecimento:

Os tokens adicionais são válidos apenas até o final do período de cobrança atual. Por exemplo, se a próxima data de cobrança for em dois dias, os tokens adicionados expirarão em dois dias.
A indexação utiliza o modelo de embedding text-embedding-3-large, que converte o texto em representações vetoriais. Isso é necessário para indexar os dados e permitir busca e recuperação.
O uso de tokens durante a indexação depende do formato do arquivo enviado. Abaixo está uma estimativa aproximada do consumo de tokens para documentos de diferentes tamanhos.
|
Formato |
1 MB |
10 MB |
100 MB |
500 MB |
|
.txt |
240,000 |
2,400,000 |
24,000,000 |
120,000,000 |
|
.csv |
450,000 |
4,500,000 |
45,000,000 |
225,000,000 |
|
.xml |
62,000 |
620,000 |
6,200,000 |
31,000,000 |
|
.htm, .html |
39,000 |
390,000 |
3,900,000 |
19,500,000 |
|
.md |
221,000 |
2,210,000 |
22,100,000 |
110,500,000 |
O uso real de tokens pode variar dependendo da estrutura e do conteúdo do arquivo.