Buscar · cafecomtech

14 resultados para "open_source"

relevância ↓

FERRAMENTAS

NVIDIA

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

A NVIDIA detalhou como o Dynamo tá atacando o gargalo de KV cache em workloads agênticos: padrão write-once-read-many com 85-97% de cache hit em Claude Code, 11.7x de razão leitura/escrita. O post cobre as 3 camadas (frontend multi-protocolo, router KV-aware com priority scheduling, e gerenciamento de cache em 4 tiers) pra fechar a lacuna entre APIs gerenciadas e quem roda modelo open-source em GPU própria.

há 4 dias · 2 min#agents

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

TECH

Hugging Face

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

A Hugging Face publicou uma Skill do Claude Code mais um test harness pra ajudar a portar modelos da biblioteca transformers pro mlx-lm quase na hora em que saem. O post é menos sobre a ferramenta e mais sobre um problema real: agentes de código viraram fábrica de PRs de baixa qualidade em projetos open source grandes, e os mantenedores tão afogados.

há 6 dias · 2 min#open_source

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

FERRAMENTAS

AWS

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

A AWS anunciou a disponibilidade das instâncias G7e no Amazon SageMaker AI, equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell Server Edition. Cada GPU tem 96 GB de GDDR7, dá pra rodar modelos de 35B num único node (g7e.2xlarge) e chegar a 300B num 8-GPU. Benchmark com Qwen3-32B mostra custo de US$ 0,79 por milhão de tokens de saída, 2,6x mais barato que G6e. Com EAGLE speculative decoding, cai pra US$ 0,41.

há 1 dia · 2 min#aws

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

TECH

Hugging Face

IA e o futuro da cibersegurança: por que abertura importa

Hugging Face publica artigo assinado por Margaret Mitchell, Yacine Jernite e Clem Delangue discutindo o impacto do Mythos e do Project Glasswing na cibersegurança. A tese: não é o modelo sozinho que encontra e corrige vulnerabilidades, é o sistema inteiro em volta dele. E ecossistemas abertos têm vantagem estrutural contra atacantes.

há 1 dia · 2 min#safety

IA e o futuro da cibersegurança: por que abertura importa

FERRAMENTAS

NVIDIA

NVIDIA NeMo RL agora roda treino de Reinforcement Learning com FP8 ponta a ponta

A NVIDIA detalhou uma receita de FP8 ponta a ponta no NeMo RL que acelera treino de RL (Reinforcement Learning) com GRPO em 15-25% nas camadas lineares e até ~48% quando estende pra KV cache e atenção. Testado em Llama 3.1 8B Instruct e Qwen3-30B, bate a acurácia do baseline BF16 usando importance sampling pra fechar o gap numérico entre vLLM (geração) e Megatron Core (treino).

há 1 dia · 2 min#llm

NVIDIA NeMo RL agora roda treino de Reinforcement Learning com FP8 ponta a ponta

FERRAMENTAS

AWS

Spring AI SDK pro Amazon Bedrock AgentCore entra em GA

AWS liberou em GA (Generally Available) o Spring AI AgentCore SDK, biblioteca open source que conecta o Amazon Bedrock AgentCore ao Spring AI via anotações e auto-configuração. Dev Java anota um método com @AgentCoreInvocation e o SDK resolve o contrato de runtime, streaming SSE, health check e rate limiting. Roda no AgentCore Runtime gerenciado ou standalone em EKS/ECS.

há 8 dias · 2 min#agents

Spring AI SDK pro Amazon Bedrock AgentCore entra em GA

FERRAMENTAS

NVIDIA

NVIDIA lança NemoClaw e OpenClaw pra rodar agente de IA local e sandboxed no DGX Spark

A NVIDIA soltou o NemoClaw, stack open-source que orquestra o OpenClaw (gateway self-hosted) e o OpenShell (runtime de segurança) pra rodar agentes autônomos localmente no DGX Spark. Usa Nemotron 3 Super 120B via Ollama, com isolamento de rede e filesystem, aprovação de policy em tempo real e integração com Telegram. Zero dado sai do device.

há 5 dias · 2 min#agents

FERRAMENTAS

NVIDIA

NVIDIA mostra como acelerar design de reatores nucleares modulares com IA física via PhysicsNeMo

A NVIDIA publicou um guia técnico pra engenheiros nucleares usarem o PhysicsNeMo (framework de AI Physics) no design de reatores modulares pequenos (SMRs) e de Geração IV. A ideia: treinar modelos surrogate baseados em Fourier Neural Operators que preveem o campo de fluxo de nêutrons e a seção de choque macroscópica diretamente da geometria da pin cell, pulando a simulação Monte Carlo cara. Resultado: R² de 0.97 contra 0.80 do baseline de regressão.

há 5 dias · 2 min#ai_physics

PRODUTO

NVIDIA

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

A NVIDIA publicou um guia prático pra rodar LLMs e VLMs grandes nos Jetson Orin Nano, Orin NX e Thor sem estourar a RAM unificada. O texto mapeia 5 camadas de otimização — do BSP até quantização — com ganhos medidos de até 10–12 GB. Inclui caso real do Reachy Mini rodando pipeline multimodal completo em 8 GB.

há 1 dia · 2 min#jetson

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

PESQUISA

Hugging Face

Ecom-RLVE: ambientes verificáveis e adaptativos pra treinar agentes conversacionais de e-commerce

Pesquisadores estenderam o framework RLVE de puzzles single-turn pra conversas multi-turn com ferramentas em e-commerce. O EcomRLVE-GYM traz 8 ambientes verificáveis (descoberta de produto, substituição, carrinho, devolução, tracking, QA de política, bundle e jornada multi-intent), cada um com geração procedural, currículo de dificuldade de 12 eixos e rewards checados por código. Treinaram Qwen 3 8B com DAPO em 300 steps.

há 6 dias · 2 min#agents

Ecom-RLVE: ambientes verificáveis e adaptativos pra treinar agentes conversacionais de e-commerce

FERRAMENTAS

NVIDIA

NVIDIA lança ALCHEMI Toolkit pra montar simulações atomísticas customizadas em GPU

A NVIDIA apresentou o ALCHEMI Toolkit, conjunto de blocos GPU-native pra simulação atomística em química e ciência dos materiais. Roda PyTorch, integra com MACE, TensorNet e AIMNet2, e deixa montar workflows batched de dinâmica molecular e relaxação geométrica. Parceiros como Orbital, MatGL e Matlantis já tão adotando, com speedups de até 33x em sistemas pequenos batched.

há 8 dias · 2 min#open_source

NVIDIA lança ALCHEMI Toolkit pra montar simulações atomísticas customizadas em GPU

FERRAMENTAS

AWS

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

A AWS publicou um guia combinando DVC (Data Version Control), Amazon SageMaker AI e SageMaker AI MLflow Apps pra resolver rastreabilidade de modelos em produção. Dois padrões acompanham notebooks prontos: lineage em nível de dataset e em nível de registro individual, esse último pensado pra compliance em saúde e finance. Tudo rodável em conta AWS própria.

há cerca de 18 horas · 2 min#mlops

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

PRODUTO

AWS

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

A AWS detalhou como os checks de Automated Reasoning no Amazon Bedrock Guardrails trocam validação probabilística por verificação matemática formal. A ideia: em vez de rodar um LLM-como-juiz avaliando outro LLM, o sistema prova logicamente se a saída bate com as regras definidas. Casos citados vão de Amazon Logistics (revisão de 8h pra minutos) a Lucid Motors com PwC (forecast de semanas pra menos de 1 minuto) e FETG com redução de 80% no setup de regras.

há 6 dias · 2 min#safety

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

FERRAMENTAS

Hugging Face

QIMMA: o leaderboard que valida benchmarks antes de avaliar LLMs em árabe

A TII (Technology Innovation Institute, de Abu Dhabi) lançou o QIMMA قِمّة, leaderboard de LLMs em árabe que inverte a lógica: valida a qualidade do benchmark ANTES de rodar os modelos. São 109 subsets, 52 mil amostras, 7 domínios e uma descoberta desconfortável — até benchmarks consagrados de árabe têm erros sistemáticos que contaminam ranking.

há 1 dia · 2 min#open_source

O que você procura?

14 resultados para "open_source"