AI Gateway
O AI Gateway é uma API para trabalhar diretamente com modelos de linguagem sem passar por agentes de IA.
Diferente da API compatível com OpenAI e da API nativa, o AI Gateway não oferece recursos de nível de agente, como:
- RAG
- MCP
- Configurações de sistema (system prompt, temperatura, limites de tamanho de resposta)
O AI Gateway é a escolha certa quando você precisa trabalhar diretamente com os modelos, sem nenhuma lógica de agente. Por exemplo:
- Você está construindo sua própria lógica em cima dos modelos (RAG personalizado, integrações com MCP)
- Você precisa de um único ponto de acesso para vários modelos
- Você já usa o OpenAI SDK e quer alternar entre modelos sem alterar o código
AI Gateway vs API compatível com OpenAI
|
API compatível com OpenAI |
AI Gateway |
|
|
Opera sobre |
Um agente |
Um modelo |
|
RAG / MCP |
Suportado |
Não suportado |
|
Configurações de sistema |
Configuradas no painel do agente |
Enviadas a cada requisição |
|
Seleção de modelo |
Modelo definido pelo agente |
Qualquer modelo disponível |
Recomendamos usar o OpenAI SDK para trabalhar com a API, ele abstrai as diferenças e simplifica a integração.
Os métodos e recursos suportados dependem do modelo utilizado. Por exemplo, o endpoint responses só está disponível para modelos com suporte a raciocínio (reasoning).
O AI Gateway não suporta:
- Files API para upload e gerenciamento de arquivos
- Fine-tuning para treinar e personalizar modelos
- Video API para trabalhar com vídeo
Conectar ao AI Gateway Copiar link
Para se conectar ao AI Gateway, acesse a aba Gateway de IA na seção Agentes de IA.
Criar uma chave de API Copiar link
O AI Gateway usa chaves separadas, não vinculadas às chaves de API da sua conta.
Para criar uma chave:
- Acesse Agentes de IA → Gateway de IA.
- Clique em Criar chave.
- Defina um nome para a chave e selecione o período de validade.
- (Opcional) Adicione uma descrição que será exibida no painel.
- (Opcional) Selecione o projeto.
- Clique em Criar.

- Copie a chave gerada e guarde-a em um local seguro.
Excluir uma chave de API Copiar link
Para excluir uma chave de API:
- Acesse Agentes de IA → Gateway de IA.
- Abra a aba Chaves de API.
- Clique no menu de três pontos ao lado da chave que deseja remover.
- Clique em Excluir.
- Confirme a ação.
Obter os dados de conexão Copiar link
Você encontra os dados de conexão na aba Conexão.
- Acesse Agentes de IA → Gateway de IA.
- Abra a aba Conexão.
- Selecione um modelo e uma linguagem de programação. A interface mostrará o preço dos tokens de entrada e saída para o modelo escolhido.
- Copie o exemplo de código de conexão e o comando para instalar a biblioteca OpenAI.
Exemplo de uso Copiar link
Recomendamos usar o OpenAI SDK para trabalhar com o AI Gateway, isso elimina a necessidade de enviar requisições HTTP manualmente e torna a integração muito mais simples.
SDKs disponíveis:
A lista completa de SDKs está disponível no repositório da OpenAI.
Os exemplos abaixo usam Python e a biblioteca openai. Instale com pip:
pip install openaiEnviar uma requisição Copiar link
Use o método Chat Completions para enviar mensagens. As mensagens são passadas no array messages.
Cada mensagem contém:
role: o papel de quem envia (user,assistant,system)content: o texto da mensagem
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
response = client.chat.completions.create(
model="MODEL_NAME",
messages=[
{
"role": "system",
"content": "Responda de forma breve e direta.",
},
{
"role": "user",
"content": "Explique o que é Kubernetes",
},
],
)
print(response.choices[0].message.content)Parâmetros:
api_key: sua chave de API do AI Gateway. Substitua pelo valor da sua chave.base_url: a URL base para conexão com o AI Gateway.model: o nome do modelo que você quer usar.messages: um array de mensagens com roles e textos.
Enviar uma requisição com histórico de mensagens Copiar link
Para preservar o contexto da conversa, envie as mensagens anteriores no array messages:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
response = client.chat.completions.create(
model="MODEL_NAME",
messages=[
{
"role": "system",
"content": "Responda apenas com frases curtas.",
},
{
"role": "user",
"content": "Quanto é 2 + 5?",
},
{
"role": "assistant",
"content": "7",
},
{
"role": "user",
"content": "Agora multiplique o resultado por 2",
},
],
)
print(response.choices[0].message.content)Neste exemplo, as mensagens anteriores (assistant e user) são incluídas para preservar o contexto da conversa.
Enviar uma requisição (Responses API) Copiar link
A Responses API é uma forma mais nova de trabalhar com os modelos. Ela simplifica a estrutura da requisição e não exige a criação explícita de um array messages.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
response = client.responses.create(
model="MODEL_NAME",
instructions="Responda de forma breve e direta.",
input="Explique o que é Kubernetes"
)
print(response.output_text)Parâmetros:
model: o nome do modelo que você quer usarinstructions: instruções para o modelo (equivalente a um system prompt)input: o texto da requisição
Enviar uma requisição com histórico de mensagens (Responses API) Copiar link
Para preservar o contexto da conversa usando a Responses API, envie o previous_response_id, que é o ID da resposta anterior.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
response = client.responses.create(
model="MODEL_NAME",
instructions="Responda apenas com frases curtas.",
input="Quanto é 2 + 5?"
)
next_response = client.responses.create(
model="MODEL_NAME",
instructions="Responda apenas com frases curtas.",
previous_response_id=response.id,
input="Agora multiplique o resultado por 2"
)
print(next_response.output_text)Neste exemplo, a primeira requisição retorna um objeto de resposta contendo um id único. Esse id é enviado como previous_response_id na próxima requisição, permitindo continuar a conversa sem reenviar todo o histórico de mensagens.
O parâmetro model deve ser informado em todas as requisições, inclusive nas chamadas seguintes que usam previous_response_id.
Listar os modelos disponíveis Copiar link
O AI Gateway permite obter a lista de modelos disponíveis:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
models = client.models.list()
for model in models.data:
print(model.id)O método models.list() retorna uma lista de modelos que podem ser usados no parâmetro model.
Usar embeddings Copiar link
Embeddings convertem texto em uma representação vetorial. Isso é útil para busca semântica, clusterização ou RAG.
O AI Gateway disponibiliza o modelo openai/text-embedding-3-large para gerar embeddings.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://ai-api.hostman.com/v1"
)
response = client.embeddings.create(
model="openai/text-embedding-3-large",
input="Texto para vetorizar",
)
print(response.data[0].embedding)O método retorna a representação vetorial do texto enviado.