EVENTO
Google
O Google lançou em Washington D.C. o AI for the Economy Forum, evento co-hospedado com o MIT FutureTech pra discutir impacto de IA em empregos e economia. Anuncia novos investimentos em pesquisa (via AI & Economy Research Program) e três programas de treinamento com Johnson & Johnson Foundation, Jobs for the Future e Manufacturing Institute. Meta: preparar trabalhadores pra transição.
FERRAMENTAS
NVIDIA
A NVIDIA publicou um guia do NVbandwidth, ferramenta CUDA que mede banda e latência de transferência de memória em sistemas com GPU. Suporta testes unidirecionais, bidirecionais, multi-GPU e multi-node, com métodos via copy engine ou kernel SM. Funciona em topologias NVLINK, NVLink C2C e PCIe, e serve pra otimização, validação de hardware e troubleshooting em aplicações CUDA.
FERRAMENTAS
AWS
A AWS publicou um guia combinando DVC (Data Version Control), Amazon SageMaker AI e SageMaker AI MLflow Apps pra resolver rastreabilidade de modelos em produção. Dois padrões acompanham notebooks prontos: lineage em nível de dataset e em nível de registro individual, esse último pensado pra compliance em saúde e finance. Tudo rodável em conta AWS própria.
há cerca de 18 horas · 2 min#mlops FERRAMENTAS
NVIDIA
A NVIDIA detalhou como o Dynamo tá atacando o gargalo de KV cache em workloads agênticos: padrão write-once-read-many com 85-97% de cache hit em Claude Code, 11.7x de razão leitura/escrita. O post cobre as 3 camadas (frontend multi-protocolo, router KV-aware com priority scheduling, e gerenciamento de cache em 4 tiers) pra fechar a lacuna entre APIs gerenciadas e quem roda modelo open-source em GPU própria.
PRODUTO
Google
O Google liberou o Skills no Chrome, feature que deixa salvar, reusar e remixar prompts do Gemini direto no navegador. Roda com / ou +, aplica na aba atual (e nas que você selecionar) e já vem com uma biblioteca pronta pra tarefas comuns. Disponível no Gemini in Chrome desktop a partir de hoje.
PRODUTO
AWS
A AWS publicou um guia arquitetural pra busca semântica em vídeo usando Nova Multimodal Embeddings no Bedrock. A solução gera embeddings separados pra visual, áudio e transcrição, combina com metadados via busca híbrida e roteia queries por intenção usando Claude Haiku. No benchmark interno, Recall@5 saltou de 51% pra 90% contra o modo combinado padrão.
há 5 dias · 2 min#embeddings