PESQUISA
NVIDIA
O AI Red Team da NVIDIA demonstrou um ataque de supply chain onde uma dependência Go maliciosa reescreve o arquivo AGENTS.md dentro do container do OpenAI Codex. O agente obedece as instruções injetadas, insere um `time.Sleep(5 * time.Minute)` no `main` e esconde a alteração do reviewer no PR. OpenAI avaliou que não eleva risco além do que dependência comprometida já permite, mas o caso abre uma dimensão nova de risco em workflows agênticos.
MODELOS
OpenAI
A OpenAI apresentou o GPT-Rosalind, modelo de raciocínio de fronteira feito pra acelerar descoberta de drogas, análise genômica, raciocínio sobre proteínas e workflows de pesquisa científica. É a primeira vez que a casa empacota um modelo específico pro domínio de life sciences, mirando laboratórios farmacêuticos e times de bioinformática.
FERRAMENTAS
OpenAI
OpenAI anunciou o Codex Labs e fechou parcerias com Accenture, PwC, Infosys e outras consultorias globais pra ajudar empresas a implantar e escalar o Codex no ciclo de desenvolvimento de software. Junto, soltou o número: 4 milhões de WAU (Weekly Active Users — usuários ativos semanais) no Codex.
PRODUTO
OpenAI
A OpenAI tá expandindo o programa Trusted Access for Cyber, que dá acesso controlado a modelos com capacidades ofensivas/defensivas pra times de segurança previamente validados. A novidade é o GPT-5.4-Cyber, versão especializada do modelo pra defensores, junto com reforço nos safeguards à medida que as capacidades de cibersegurança da IA avançam.
FERRAMENTAS
OpenAI
OpenAI soltou uma nova versão do Agents SDK com dois reforços: execução em sandbox nativa e um harness model-native. A ideia é deixar dev construir agentes mais seguros e capazes de rodar tarefas longas, cruzando arquivos e ferramentas sem sair do trilho. É atualização incremental, mas mira direto no gargalo de quem tenta colocar agente em produção.
PRODUTO
OpenAI
A OpenAI anunciou o Trusted Access for Cyber, programa que junta empresas de segurança e grandes corporações pra usar o GPT-5.4-Cyber (modelo especializado em cyber defense) mais US$ 10 milhões em créditos de API. A ideia é acelerar defesa cibernética global com acesso antecipado a modelo dedicado pra time de security.
PRODUTO
OpenAI
A OpenAI atualizou o app Codex pra macOS e Windows com um combo novo: computer use (o modelo controlando o computador), browser embutido, geração de imagem, memória e plugins. O pitch é clássico: acelerar workflow de dev sem trocar de janela o tempo todo.
NEGÓCIOS
OpenAI
A Hyatt liberou ChatGPT Enterprise pra força de trabalho global, usando GPT-5.4 e Codex. A OpenAI posiciona o caso como ganho em produtividade, operação interna e experiência de hóspede. Mais um contrato grande de rede hoteleira entrando no catálogo Enterprise da OpenAI, sem número de licença divulgado.
PRODUTO
AWS
A AWS detalhou como os checks de Automated Reasoning no Amazon Bedrock Guardrails trocam validação probabilística por verificação matemática formal. A ideia: em vez de rodar um LLM-como-juiz avaliando outro LLM, o sistema prova logicamente se a saída bate com as regras definidas. Casos citados vão de Amazon Logistics (revisão de 8h pra minutos) a Lucid Motors com PwC (forecast de semanas pra menos de 1 minuto) e FETG com redução de 80% no setup de regras.
PESQUISA
Hugging Face
IBM Research soltou o VAKRA, benchmark executável com 8.000+ APIs locais em 62 domínios pra medir se agentes de IA dão conta de workflows multi-step de verdade. Spoiler: dão mal. O post abre os 4 tipos de tarefa, o pipeline de avaliação em cascata e análise detalhada de onde modelos como GPT-OSS-120B, Gemini-3-flash-preview e Claude-Sonnet-4-5 quebram.
FERRAMENTAS
AWS
AWS liberou em GA (Generally Available) o Spring AI AgentCore SDK, biblioteca open source que conecta o Amazon Bedrock AgentCore ao Spring AI via anotações e auto-configuração. Dev Java anota um método com @AgentCoreInvocation e o SDK resolve o contrato de runtime, streaming SSE, health check e rate limiting. Roda no AgentCore Runtime gerenciado ou standalone em EKS/ECS.
PRODUTO
Microsoft
Microsoft empurrou três atualizações de Reinforcement Fine-Tuning no Foundry: Global Training pro o4-mini em 13+ regiões Azure com preço menor por token, GPT-4.1/mini/nano liberados como model graders e um guia consolidado de boas práticas. Foco claro em baratear RFT e dar mais flexibilidade pra quem avalia saídas open-ended.
PRODUTO
Google
Google acoplou o que chama de Personal Intelligence ao Nano Banana 2: o Gemini puxa contexto dos seus apps Google e da biblioteca do Google Photos pra gerar imagens com você e família sem upload manual nem prompt gigante. Rollout em dias pros assinantes Google AI Plus, Pro e Ultra nos EUA.
há 6 dias · 2 min#multimodal FERRAMENTAS
Hugging Face
A HCompany soltou o HoloTab, extensão gratuita do Chrome que roda em cima do Holo3, o modelo de computer-use da casa lançado em 31 de março. Você descreve a tarefa e o agente navega, clica e preenche campos como se fosse um humano. Tem também o modo Routines: grava uma vez o que você faz, e depois o HoloTab repete sozinho ou em horário agendado.