A Microsoft colocou em public preview os hosted agents no Foundry Agent Service: compute pensado pra agentes de produção, com sandbox isolado por sessão via hypervisor, filesystem que sobrevive a scale-to-zero, identidade por agente (Entra Agent ID) e suporte a qualquer framework (LangGraph, Claude Agent SDK, OpenAI Agents SDK). Deploy num comando: azd deploy.
Microsoft tá empacotando o que Anthropic, OpenAI e Google oferecem em pedaços separados (sandbox, memória, identidade, observabilidade) numa plataforma só. Pra time enterprise que já vive no Azure/Entra, é caminho de menor atrito pra colocar agente em produção sem montar infra do zero.
A Microsoft anunciou os hosted agents no Foundry Agent Service, em public preview. É compute otimizado pra rodar agentes de produção em escala enterprise, com sandbox isolado por sessão, filesystem persistente, identidade integrada e economia de scale-to-zero (você paga zero quando o agente tá ocioso).
A Microsoft já tinha mostrado uma versão disso na Ignite do ano passado, mas esse refresh é outra coisa: sandbox por sessão com hypervisor isolation de verdade, não só isolamento de processo ou execução de código.
Compute tradicional (containers, web apps, serverless) foi desenhado pra web services onde múltiplos usuários compartilham a mesma instância. Pra agente não funciona.
Quando Cliente A e Cliente B chamam o mesmo agente, e esse agente escreve arquivos, executa código arbitrário e acessa credenciais numa instância compartilhada, você tem pesadelo de segurança. Harness de agente precisa ler e escrever state, rodar código qualquer e segurar contexto sensível. Dividir container entre sessões é inseguro.
A real é que escrever o agente virou a parte fácil. Difícil é deixar ele enterprise-ready com isolamento, identidade e governança de verdade. É aí que a Microsoft tá apostando.
| Compute tradicional | Hosted Agents | |
|---|---|---|
| Isolamento | Várias sessões dividem container | Cada sessão num sandbox dedicado |
| Cold starts | Segundos a minutos (variância alta) | Segundos (baixa variância) |
| Custo ocioso | Billing always-on ou scale-from-zero lento | Scale to zero com filesystem preservado |
| Persistência de state | Você constrói (banco, storage externo) | Embutido: files e disk sobrevivem |
| Identidade | Service account compartilhada | Identidade por agente + por user (OBO) |
| Observabilidade | Você constrói | Embutida (agente, sessão, fleet) |
Em vez de prender você num runtime específico, dá pra trazer o que quiser: LangGraph, Microsoft Agent Framework, Claude Agent SDK, OpenAI Agents SDK, GitHub Copilot SDK. Define ambiente via Dockerfile, deploya com azd deploy, Foundry cuida do resto.
Roda modelos da OpenAI, Anthropic, Meta, Mistral e outros. Multi-model e multi-harness por design.
Esse posicionamento é direto contra plataformas que amarram você num modelo e um harness só. Pra quem já tá em Azure e quer evitar lock-in de runtime de agente, é argumento forte.
Junto com hosted agents, vieram vários anúncios que completam a plataforma:
Na parte enterprise:
A Microsoft tá prometendo agentes self-optimizing e long-running: o agente de prep de reunião não começa do zero toda segunda, a 10ª briefing aproveita as 9 anteriores. Contexto que acumula sozinho. General Availability ainda sem data.
azd deploy sobe um hosted agent e você vê rodando☕ gostou dessa?
Matérias favoritadas ficam no seu /favoritos e, se você tem o cafecomtech instalado, disponíveis offline — no metrô, no avião, na fila do café.
☕ comentários · 0