arquivo

Toda a timeline, dia por dia.

Navega pelo calendário ou filtra por período / empresa. A gente nunca apaga.

matérias publicadas por dia · 2026

2026

jan

fev

mar

abr

mai

jun

jul

ago

set

out

nov

dez

menos

maistotal · 103 matérias em 2026

103 matérias nos últimos 630 dias

Ontem

7 matérias

PRODUTO

NVIDIAde olho

DeepSeek V4 chega com janela de 1M tokens e roda no NVIDIA Blackwell direto de fábrica

A DeepSeek lançou a quarta geração da família, com DeepSeek-V4-Pro (1.6T parâmetros totais, 49B ativos) e DeepSeek-V4-Flash (284B totais, 13B ativos). Ambos suportam contexto de 1M tokens e prometem 73% menos FLOPs por token e 90% menos memória de KV cache que o V3.2. NVIDIA mostra +150 tokens/s/usuário no GB200 NVL72 e libera os modelos em endpoints acelerados no build.nvidia.com.

por mateus v.há cerca de 14 horas4 min#llm

quinta-feira · 23 de abr

10 matérias

FERRAMENTAS

AWSteatro

Amazon Quick pra marketing: da bagunça de dados à ação estratégica

A AWS tá posicionando o Amazon Quick como assistente de IA pra times de marketing conectarem dados espalhados entre HubSpot, Salesforce, Adobe, Slack e Asana. A proposta: relatórios de campanha em minutos, análise competitiva em 30 minutos, e pacotes de conteúdo gerados a partir das campanhas passadas. Integra via MCP e OpenAPI, roda na AWS com dados no ambiente do cliente.

por mateus v.há 2 dias4 min#agents

quarta-feira · 22 de abr

26 matérias

FERRAMENTAS

NVIDIAde olho

NVIDIA integra Universal Sparse Tensor ao nvmath-python 0.9.0 e promete até 444x de speedup em SpMV

A NVIDIA integrou o Universal Sparse Tensor (UST) ao nvmath-python v0.9.0, com interop zero-copy pra PyTorch, SciPy, CuPy e NumPy. Dá pra converter entre formatos densos e esparsos (COO, CSR, CSC, BSR, DIA e customizados) sem mover dados, definir novos esquemas de sparsity via DSL e injetar direto em modelos PyTorch. Nos benchmarks de SpMV, bateu CuPy e PyTorch em até 444x.

por mateus v.há 3 dias5 min#sparse_tensors

terça-feira · 21 de abr

9 matérias

PRODUTO

AWS

AWS lança Claude Cowork no Amazon Bedrock pra levar Claude Desktop pra toda a empresa

A AWS anunciou o Claude Cowork no Amazon Bedrock: agora dá pra rodar o Cowork e o Claude Code Desktop via Bedrock, direto ou por um LLM gateway. A ideia é estender o Claude além do time de dev e levar pra qualquer knowledge worker da organização, mantendo dados no ambiente AWS do cliente. Billing consumption-based, sem licença por seat da Anthropic.

por mateus v.há 4 dias4 min#llm#agents

segunda-feira · 20 de abr

9 matérias

PRODUTO

NVIDIA

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

A NVIDIA publicou um guia prático pra rodar LLMs e VLMs grandes nos Jetson Orin Nano, Orin NX e Thor sem estourar a RAM unificada. O texto mapeia 5 camadas de otimização — do BSP até quantização — com ganhos medidos de até 10–12 GB. Inclui caso real do Reachy Mini rodando pipeline multimodal completo em 8 GB.

por mateus v.há 5 dias5 min#jetson#edge_ai

sexta-feira · 17 de abr

11 matérias

FERRAMENTAS

NVIDIAde olho

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

A NVIDIA detalhou como o Dynamo tá atacando o gargalo de KV cache em workloads agênticos: padrão write-once-read-many com 85-97% de cache hit em Claude Code, 11.7x de razão leitura/escrita. O post cobre as 3 camadas (frontend multi-protocolo, router KV-aware com priority scheduling, e gerenciamento de cache em 4 tiers) pra fechar a lacuna entre APIs gerenciadas e quem roda modelo open-source em GPU própria.

por mateus v.há 8 dias10 min#agents

quinta-feira · 16 de abr

16 matérias

PRODUTO

Microsoft

Microsoft Foundry Fine-Tuning em abril de 2026: Global Training pro o4-mini, novos graders GPT-4.1 e guia de RFT

Microsoft empurrou três atualizações de Reinforcement Fine-Tuning no Foundry: Global Training pro o4-mini em 13+ regiões Azure com preço menor por token, GPT-4.1/mini/nano liberados como model graders e um guia consolidado de boas práticas. Foco claro em baratear RFT e dar mais flexibilidade pra quem avalia saídas open-ended.

por mateus v.há 9 dias6 min#llm#fine_tuning

quarta-feira · 15 de abr

6 matérias

PRODUTO

AWS

Amazon QuickSight ganha sheet tooltips: tooltips customizados com gráficos, KPIs e imagens

A AWS anunciou os sheet tooltips no Amazon QuickSight. Autores de dashboard agora montam tooltips customizados em layout free-form, misturando gráficos, KPIs, texto e imagens num único tooltip que atualiza dinâmico quando o leitor passa o mouse sobre pontos de dados. Funciona com a maioria dos tipos de visual e o mesmo tooltip pode ser reusado em múltiplos gráficos.

há 10 dias3 min#aws#quicksight

Amazon QuickSight ganha sheet tooltips: tooltips customizados com gráficos, KPIs e imagens

terça-feira · 14 de abr

9 matérias

PRODUTO

AWS

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

A AWS liberou os optimized deployments no SageMaker JumpStart: configurações pré-definidas de deploy pra casos de uso específicos como geração de conteúdo, resumo e Q&A. Em vez de só escolher número de usuários simultâneos, agora dá pra otimizar por custo, throughput ou latência. Disponível pra Llama, Mistral, Qwen, Gemma e outros modelos open.

há 11 dias2 min#sagemaker#ml_deployment

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

← carregar mais antigas (próximos 30 dias)