Login
Login

Preços de agentes e base de conhecimento

Atualizado em 19 de March de 2026

Agentes de IA utilizam modelos de linguagem de grande porte e uma base de conhecimento. Esta seção descreve os modelos disponíveis, os preços e como os tokens são contabilizados.

Modelos disponíveis

Oferecemos acesso aos seguintes modelos de linguagem de grande porte:

Provider

Modelo

Raciocínio

OpenAI

GPT-5.1

OpenAI

GPT-5.2

OpenAI

GPT-5.3 Codex

OpenAI

GPT-5.4

DeepSeek

DeepSeek v3.2

xAI

Grok 4.1 Fast

xAI

Grok 4.1 Fast

Anthropic

Claude Haiku 4.5

Anthropic

Claude Opus 4.6

Anthropic

Claude Sonnet 4.6

Google AI

Gemini 2.5 Flash Lite

Google AI

Gemini 3 Flash Preview

Google AI

Gemini 3.1 Pro Preview

Google AI

Gemini 3.1 Flash Lite Preview

Qwen

Qwen 3.5 Flash

Qwen

Qwen 3.5 Flash

Qwen

Qwen 3.5 Plus

Qwen

Qwen 3.5 Plus

Qwen

Qwen 3 Max

Como os tokens funcionam

Os modelos processam texto dividindo-o em unidades menores chamadas tokens. Um token pode ser:

  • parte de uma palavra (por exemplo, "techno" + "logy");
  • uma palavra curta;
  • um símbolo ou sinal de pontuação.

Em média, 1.000 tokens ≈ 750 palavras.

Esses valores são aproximados e servem apenas para dar uma ideia geral dos custos de uso. Cada modelo utiliza seu próprio tokenizador e divide o texto de forma diferente.

Os tokens são cobrados tanto na entrada quanto na saída. Por exemplo, se sua solicitação contém 20 tokens e o modelo gera uma resposta de 30 tokens, um total de 50 tokens será descontado da sua cota.

Modelos com raciocínio

Se um modelo exibe um ícone de cérebro, isso significa que ele oferece suporte ao modo de raciocínio.

Nesse modo, o modelo gera etapas intermediárias de raciocínio antes de produzir a resposta final. Ele faz perguntas de esclarecimento para si mesmo e responde internamente. Isso ajuda a gerar respostas mais precisas e bem estruturadas, especialmente para tarefas complexas.

Cada etapa de raciocínio exige texto adicional de entrada e saída, o que aumenta o consumo de tokens.

O modo de raciocínio não pode ser desativado.

Preços dos agentes

Os agentes de IA oferecem dois tipos de cobrança:

  • Planos base: pacotes fixos de tokens que são renovados automaticamente todos os meses.
  • Pacotes adicionais de tokens: compras únicas de tokens válidas apenas até o final do período de cobrança atual do plano base.

Planos base

Os preços de cada modelo estão disponíveis no painel de controle ao criar um agente.

A taxa do plano é cobrada uma vez quando o agente é criado ou quando o plano é alterado. No mês seguinte, o plano é renovado com uma nova cobrança única. Tokens não utilizados no mês atual não são acumulados para o próximo período.

A quantidade ideal de tokens para o seu agente só pode ser determinada durante o uso real, monitorando o consumo.

Ao começar, recomendamos escolher o menor plano adequado e aumentá-lo posteriormente, se necessário. Não é possível fazer downgrade do plano.

Pacotes adicionais de tokens

Se você precisar de mais tokens, mas o próximo nível de plano for grande demais, ou se precisar de tokens adicionais apenas temporariamente, você pode comprar pacotes adicionais de tokens no painel de controle em vez de alterar o plano.

Você pode configurar a quantidade de tokens em incrementos de 250.000. O pacote permanece válido apenas até o final do período de cobrança atual; você pode verificar a data de renovação em Faturamento → Histórico de faturamento.

A taxa do pacote é cobrada uma única vez. Seu plano não é alterado, e a taxa padrão do plano será cobrada novamente no próximo mês.

Preços da base de conhecimento

Como o preço é calculado

O custo de uma base de conhecimento é composto por dois elementos:

  • Taxa de assinatura de tokens. Quando uma base de conhecimento é criada, são cobrados $5.63 por 10 milhões de tokens. Esses tokens são usados para indexação da base de conhecimento e para todas as consultas feitas a ela. Essa cobrança se repete mensalmente.
  • Taxa por hora do banco de dados OpenSearch. A base de conhecimento é executada em um banco de dados em nuvem. Após a criação do banco, a cobrança por hora é iniciada. O custo depende da configuração selecionada.

Ao criar o banco de dados, escolha a menor configuração adequada. Você pode aumentá-la posteriormente, se necessário, mas não é possível fazer downgrade.

Exemplo de preços

Ao criar uma base de conhecimento com a configuração mínima:

  • $5.63 são cobrados imediatamente por 10 milhões de tokens (cobrança mensal).
  • $0.06831 por hora são cobrados pelo banco de dados enquanto ele estiver em execução ao longo do mês.

Tokens adicionais

Se necessário, você pode adicionar tokens ao custo de $0.75 por 1.000.000 de tokens clicando em Adicionar tokens no painel (Dashboard) da base de conhecimento:

E0bbab49 9b14 4231 99a0 97fc037a5dd1

Os tokens adicionais são válidos apenas até o final do período de cobrança atual. Por exemplo, se a próxima data de cobrança for em dois dias, os tokens adicionados expirarão em dois dias.

Uso de tokens durante a indexação

A indexação utiliza o modelo de embedding text-embedding-3-large, que converte o texto em representações vetoriais. Isso é necessário para indexar os dados e permitir busca e recuperação.

O uso de tokens durante a indexação depende do formato do arquivo enviado. Abaixo está uma estimativa aproximada do consumo de tokens para documentos de diferentes tamanhos.

Formato

1 MB

10 MB

100 MB

500 MB

.txt

240,000

2,400,000

24,000,000

120,000,000

.csv

450,000

4,500,000

45,000,000

225,000,000

.xml

62,000

620,000

6,200,000

31,000,000

.htm, .html

39,000

390,000

3,900,000

19,500,000

.md

221,000

2,210,000

22,100,000

110,500,000

O uso real de tokens pode variar dependendo da estrutura e do conteúdo do arquivo.

Esta página foi útil?
Atualizado em 19 de March de 2026

Tem perguntas,
comentários ou preocupações?

Nossos profissionais estão disponíveis para ajudá-lo a qualquer momento,
seja para assistência ou apenas se você não souber por onde começar.
Envie-nos um e-mail
Hostman's Support