PRODUTO · OPENAI · 22 ABR 2026

OpenAI acelera workflows de agentes com WebSockets na Responses API

A OpenAI publicou um mergulho técnico no loop de agente do Codex, mostrando como trocou HTTP por WebSockets e aplicou cache escopado por conexão pra cortar overhead de API e melhorar a latência do modelo. É o tipo de otimização que importa quando o agente faz centenas de chamadas por sessão.

Curadoria cafecomtech2 min de leitura#agents#api#performance

OpenAI acelera workflows de agentes com WebSockets na Responses API foi anunciado em 22 de abril às 10:00, horário de Brasília. fonte original →

00:00 / 02:10

voz sintética · pt-br

A OpenAI soltou um post técnico detalhando como o time do Codex acelerou o loop de agente usando WebSockets na Responses API, combinado com cache escopado por conexão.

O problema

Agente não é request-response simples. Cada turno do Codex dispara várias chamadas ao modelo, e cada chamada via HTTP tradicional carrega overhead de handshake, autenticação e setup de contexto. Em workflow longo, isso vira gargalo real de latência.

A solução

Dois movimentos principais:

WebSockets no lugar de HTTP request-response: mantém conexão persistente entre cliente e API, cortando overhead de setup a cada chamada.
Cache escopado por conexão: estado que antes era reconstruído a cada request fica cacheado enquanto a conexão vive, reduzindo trabalho redundante no servidor.

O resultado é menos overhead de API e latência de modelo menor no loop do agente.

Na prática, essa é a direção que toda infra de agente vai ter que seguir: quem roda agente em produção com dezenas de tool calls por sessão sente na veia o custo do HTTP stateless. WebSocket + cache de conexão é arroz com feijão de sistema distribuído, só que agora aplicado no loop de LLM.

Pra quem importa

Se você tá construindo agente em cima da Responses API e tá vendo latência acumular a cada iteração, vale ler o post original pra pegar os detalhes de implementação. Pra quem usa Codex direto, é otimização transparente: o agente fica mais rápido sem mudar nada no teu lado.

☕ gostou dessa?

Salva pra ler de novo — inclusive offline.

Matérias favoritadas ficam no seu /favoritos e, se você tem o cafecomtech instalado, disponíveis offline — no metrô, no avião, na fila do café.

Offlineguardada no app pra leitura sem internet

Arquivo seunão some quando atualizamos a matéria

Revisitede qualquer dispositivo logado

também pelo 🔖 no header

☕ comentários · 0

Entra pra deixar um comentário. Magic link, sem senha.

Sem comentários ainda. Seja o primeiro.