Preços de agentes e base de conhecimento

Produtos

Plataforma de apps
- Overview
- Como funciona
- Cobrança de aplicações frontend
- Conectar repositórios
- Fazer deploy de apps frontend
- Fazer deploy de apps de backend
- Fazer deploy com Dockerfile
- Fazer deploy com Docker Compose
- Gerenciar apps
- App Healthcheck
- Variáveis
- Ambientes
- FAQ
Agentes de IA
- Overview
- Gerenciar agentes
- Gerenciar bases de conhecimento
- Usar API
- Preços
Bancos de dados em nuvem
Servidores em nuvem
Kubernetes
- Overview
- Criar clusters
- Conectar ao cluster
- Gerenciar clusters
- Balancear carga
- Autoescalonamento
- Configurar o Provedor OIDC
- Configurar e usar o Helm
- Criar charts do Helm
- Plugins de rede (CNI)
- Add-ons
Armazenamento de objetos S3
- Overview
- Gerenciar armazenamento
- Ferramentas
- Casos de uso
- Recursos suportados
- Usar SDKs do S3
VPC
IP público
Balanceadores de carga
Firewall
Domínios

Guias da Plataforma

Gerenciar sua conta
Faturamento
- Overview
- Vincular um cartão
Terraform
- Overview
- Começar a usar o Terraform

Atualizado em 19 de March de 2026

Agentes de IA utilizam modelos de linguagem de grande porte e uma base de conhecimento. Esta seção descreve os modelos disponíveis, os preços e como os tokens são contabilizados.

Modelos disponíveis

Oferecemos acesso aos seguintes modelos de linguagem de grande porte:

Provider	Modelo	Raciocínio
OpenAI	GPT-5.1	✅
OpenAI	GPT-5.2	✅
OpenAI	GPT-5.3 Codex	✅
OpenAI	GPT-5.4	✅
DeepSeek	DeepSeek v3.2	✅
xAI	Grok 4.1 Fast	✅
xAI	Grok 4.1 Fast	❌
Anthropic	Claude Haiku 4.5	✅
Anthropic	Claude Opus 4.6	✅
Anthropic	Claude Sonnet 4.6	✅
Google AI	Gemini 2.5 Flash Lite	❌
Google AI	Gemini 3 Flash Preview	✅
Google AI	Gemini 3.1 Pro Preview	✅
Google AI	Gemini 3.1 Flash Lite Preview	✅
Qwen	Qwen 3.5 Flash	❌
Qwen	Qwen 3.5 Flash	✅
Qwen	Qwen 3.5 Plus	❌
Qwen	Qwen 3.5 Plus	✅
Qwen	Qwen 3 Max	❌

Como os tokens funcionam

Os modelos processam texto dividindo-o em unidades menores chamadas tokens. Um token pode ser:

parte de uma palavra (por exemplo, "techno" + "logy");
uma palavra curta;
um símbolo ou sinal de pontuação.

Em média, 1.000 tokens ≈ 750 palavras.

Esses valores são aproximados e servem apenas para dar uma ideia geral dos custos de uso. Cada modelo utiliza seu próprio tokenizador e divide o texto de forma diferente.

Os tokens são cobrados tanto na entrada quanto na saída. Por exemplo, se sua solicitação contém 20 tokens e o modelo gera uma resposta de 30 tokens, um total de 50 tokens será descontado da sua cota.

Modelos com raciocínio

Se um modelo exibe um ícone de cérebro, isso significa que ele oferece suporte ao modo de raciocínio.

Nesse modo, o modelo gera etapas intermediárias de raciocínio antes de produzir a resposta final. Ele faz perguntas de esclarecimento para si mesmo e responde internamente. Isso ajuda a gerar respostas mais precisas e bem estruturadas, especialmente para tarefas complexas.

Cada etapa de raciocínio exige texto adicional de entrada e saída, o que aumenta o consumo de tokens.

O modo de raciocínio não pode ser desativado.

Preços dos agentes

Os agentes de IA oferecem dois tipos de cobrança:

Planos base: pacotes fixos de tokens que são renovados automaticamente todos os meses.
Pacotes adicionais de tokens: compras únicas de tokens válidas apenas até o final do período de cobrança atual do plano base.

Planos base

Os preços de cada modelo estão disponíveis no painel de controle ao criar um agente.

A taxa do plano é cobrada uma vez quando o agente é criado ou quando o plano é alterado. No mês seguinte, o plano é renovado com uma nova cobrança única. Tokens não utilizados no mês atual não são acumulados para o próximo período.

A quantidade ideal de tokens para o seu agente só pode ser determinada durante o uso real, monitorando o consumo.

Ao começar, recomendamos escolher o menor plano adequado e aumentá-lo posteriormente, se necessário. Não é possível fazer downgrade do plano.

Pacotes adicionais de tokens

Se você precisar de mais tokens, mas o próximo nível de plano for grande demais, ou se precisar de tokens adicionais apenas temporariamente, você pode comprar pacotes adicionais de tokens no painel de controle em vez de alterar o plano.

Você pode configurar a quantidade de tokens em incrementos de 250.000. O pacote permanece válido apenas até o final do período de cobrança atual; você pode verificar a data de renovação em Faturamento → Histórico de faturamento.

A taxa do pacote é cobrada uma única vez. Seu plano não é alterado, e a taxa padrão do plano será cobrada novamente no próximo mês.

Preços da base de conhecimento

Como o preço é calculado

O custo de uma base de conhecimento é composto por dois elementos:

Taxa de assinatura de tokens. Quando uma base de conhecimento é criada, são cobrados $5.63 por 10 milhões de tokens. Esses tokens são usados para indexação da base de conhecimento e para todas as consultas feitas a ela. Essa cobrança se repete mensalmente.
Taxa por hora do banco de dados OpenSearch. A base de conhecimento é executada em um banco de dados em nuvem. Após a criação do banco, a cobrança por hora é iniciada. O custo depende da configuração selecionada.

Ao criar o banco de dados, escolha a menor configuração adequada. Você pode aumentá-la posteriormente, se necessário, mas não é possível fazer downgrade.

Exemplo de preços

Ao criar uma base de conhecimento com a configuração mínima:

$5.63 são cobrados imediatamente por 10 milhões de tokens (cobrança mensal).
$0.06831 por hora são cobrados pelo banco de dados enquanto ele estiver em execução ao longo do mês.

Tokens adicionais

Se necessário, você pode adicionar tokens ao custo de $0.75 por 1.000.000 de tokens clicando em Adicionar tokens no painel (Dashboard) da base de conhecimento:

Os tokens adicionais são válidos apenas até o final do período de cobrança atual. Por exemplo, se a próxima data de cobrança for em dois dias, os tokens adicionados expirarão em dois dias.

Uso de tokens durante a indexação

A indexação utiliza o modelo de embedding text-embedding-3-large, que converte o texto em representações vetoriais. Isso é necessário para indexar os dados e permitir busca e recuperação.

O uso de tokens durante a indexação depende do formato do arquivo enviado. Abaixo está uma estimativa aproximada do consumo de tokens para documentos de diferentes tamanhos.

Formato	1 MB	10 MB	100 MB	500 MB
.txt	240,000	2,400,000	24,000,000	120,000,000
.csv	450,000	4,500,000	45,000,000	225,000,000
.xml	62,000	620,000	6,200,000	31,000,000
.htm, .html	39,000	390,000	3,900,000	19,500,000
.md	221,000	2,210,000	22,100,000	110,500,000

O uso real de tokens pode variar dependendo da estrutura e do conteúdo do arquivo.

Esta página foi útil?