arquivo

Toda a timeline, dia por dia.

Navega pelo calendário ou filtra por período / empresa. A gente nunca apaga.

matérias publicadas por dia · 2026

2026

jan

fev

mar

abr

mai

jun

jul

ago

set

out

nov

dez

menos

maistotal · 16 matérias em 2026

16 matérias nos últimos 1950 dias · NVIDIA

Hoje

2 matérias

FERRAMENTAS

NVIDIA

NVIDIA BioNeMo escala modelagem biomolecular com context parallelism e quebra barreira de memória da GPU

O time do NVIDIA BioNeMo lançou um framework de context parallelism (CP) que faz sharding de uma única molécula gigante entre várias GPUs. Na prática, dá pra dobrar proteínas de 3.605 resíduos em 4 H100s, e até 20.000 tokens em 256 GPUs. Quebra o limite que forçava biólogos computacionais a fragmentar proteínas grandes pra caber numa GPU só.

há cerca de 6 horas6 min#coding#open_source

NVIDIA BioNeMo escala modelagem biomolecular com context parallelism e quebra barreira de memória da GPU

sexta-feira · 24 de abr

2 matérias

PRODUTO

NVIDIAde olho

DeepSeek V4 chega com janela de 1M tokens e roda no NVIDIA Blackwell direto de fábrica

A DeepSeek lançou a quarta geração da família, com DeepSeek-V4-Pro (1.6T parâmetros totais, 49B ativos) e DeepSeek-V4-Flash (284B totais, 13B ativos). Ambos suportam contexto de 1M tokens e prometem 73% menos FLOPs por token e 90% menos memória de KV cache que o V3.2. NVIDIA mostra +150 tokens/s/usuário no GB200 NVL72 e libera os modelos em endpoints acelerados no build.nvidia.com.

por mateus v.há 4 dias4 min#llm

quarta-feira · 22 de abr

3 matérias

FERRAMENTAS

NVIDIAde olho

NVIDIA integra Universal Sparse Tensor ao nvmath-python 0.9.0 e promete até 444x de speedup em SpMV

A NVIDIA integrou o Universal Sparse Tensor (UST) ao nvmath-python v0.9.0, com interop zero-copy pra PyTorch, SciPy, CuPy e NumPy. Dá pra converter entre formatos densos e esparsos (COO, CSR, CSC, BSR, DIA e customizados) sem mover dados, definir novos esquemas de sparsity via DSL e injetar direto em modelos PyTorch. Nos benchmarks de SpMV, bateu CuPy e PyTorch em até 444x.

por mateus v.há 6 dias5 min#sparse_tensors

segunda-feira · 20 de abr

3 matérias

PRODUTO

NVIDIA

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

A NVIDIA publicou um guia prático pra rodar LLMs e VLMs grandes nos Jetson Orin Nano, Orin NX e Thor sem estourar a RAM unificada. O texto mapeia 5 camadas de otimização — do BSP até quantização — com ganhos medidos de até 10–12 GB. Inclui caso real do Reachy Mini rodando pipeline multimodal completo em 8 GB.

por mateus v.há 8 dias5 min#jetson#edge_ai

sexta-feira · 17 de abr

3 matérias

FERRAMENTAS

NVIDIAde olho

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

A NVIDIA detalhou como o Dynamo tá atacando o gargalo de KV cache em workloads agênticos: padrão write-once-read-many com 85-97% de cache hit em Claude Code, 11.7x de razão leitura/escrita. O post cobre as 3 camadas (frontend multi-protocolo, router KV-aware com priority scheduling, e gerenciamento de cache em 4 tiers) pra fechar a lacuna entre APIs gerenciadas e quem roda modelo open-source em GPU própria.

por mateus v.há 11 dias10 min#agents

terça-feira · 14 de abr

3 matérias

FERRAMENTAS

NVIDIA

NVIDIA lança ALCHEMI Toolkit pra montar simulações atomísticas customizadas em GPU

A NVIDIA apresentou o ALCHEMI Toolkit, conjunto de blocos GPU-native pra simulação atomística em química e ciência dos materiais. Roda PyTorch, integra com MACE, TensorNet e AIMNet2, e deixa montar workflows batched de dinâmica molecular e relaxação geométrica. Parceiros como Orbital, MatGL e Matlantis já tão adotando, com speedups de até 33x em sistemas pequenos batched.

há 14 dias4 min#open_source#coding

NVIDIA lança ALCHEMI Toolkit pra montar simulações atomísticas customizadas em GPU

← carregar mais antigas (próximos 30 dias)

Toda a timeline, dia por dia.

Hoje

NVIDIA BioNeMo escala modelagem biomolecular com context parallelism e quebra barreira de memória da GPU

sexta-feira · 24 de abr

DeepSeek V4 chega com janela de 1M tokens e roda no NVIDIA Blackwell direto de fábrica

quarta-feira · 22 de abr

NVIDIA integra Universal Sparse Tensor ao nvmath-python 0.9.0 e promete até 444x de speedup em SpMV

segunda-feira · 20 de abr

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

sexta-feira · 17 de abr

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

terça-feira · 14 de abr

NVIDIA lança ALCHEMI Toolkit pra montar simulações atomísticas customizadas em GPU

NVIDIA lança Nemotron 3 Nano Omni: modelo aberto unifica vídeo, áudio, imagem e texto em uma só MoE

NVIDIA FLARE corta o overhead de refactoring pra rodar federated learning

NVIDIA lança RTX PRO 4500 Blackwell Server Edition e vGPU 20 pra escalar data center com IA

NVIDIA Megatron ganha suporte a Muon e outros otimizadores emergentes pra treino de LLM em escala

NVIDIA NeMo RL agora roda treino de Reinforcement Learning com FP8 ponta a ponta

NVIDIA Red Team mostra ataque de injeção indireta via AGENTS.md no OpenAI Codex

NVIDIA lança NemoClaw e OpenClaw pra rodar agente de IA local e sandboxed no DGX Spark

NVIDIA mostra como acelerar design de reatores nucleares modulares com IA física via PhysicsNeMo

NVIDIA NVbandwidth: ferramenta pra medir performance de interconexão e memória em GPU

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas