Arquivo · cafecomtech

FERRAMENTAS

NVIDIA integra Universal Sparse Tensor ao nvmath-python 0.9.0 e promete até 444x de speedup em SpMV

A NVIDIA integrou o Universal Sparse Tensor (UST) ao nvmath-python v0.9.0, com interop zero-copy pra PyTorch, SciPy, CuPy e NumPy. Dá pra converter entre formatos densos e esparsos (COO, CSR, CSC, BSR, DIA e customizados) sem mover dados, definir novos esquemas de sparsity via DSL e injetar direto em modelos PyTorch. Nos benchmarks de SpMV, bateu CuPy e PyTorch em até 444x.

por mateus v.há 1 dia5 min#sparse_tensors

PESQUISA

Anthropic

Anthropic detalha o time de Societal Impacts e a agenda de pesquisa sobre uso real de IA

A Anthropic publicou a página do time de Societal Impacts, grupo técnico que estuda como a IA é usada (e mal usada) no mundo real. Trabalha colado com os times de Policy e Safeguards, desenvolve experimentos, métodos de treino e avaliações. A página lista pesquisas recentes, incluindo o estudo com 81 mil users do Claude.ai e relatórios sobre impacto no trabalho de engenharia.

há 1 dia3 min#safety#societal_impact

PESQUISA

Anthropicde olho

Interpretability: a Anthropic abrindo a caixa-preta dos LLMs pra entender o que acontece dentro

A Anthropic mantém uma página dedicada ao time de Interpretability, cuja missão é descobrir como LLMs funcionam por dentro. A ideia é virar base pra AI safety: entender circuitos, persona vectors, introspecção do modelo e como conceitos são representados. Lista também o portfólio de papers, de Toy Models of Superposition (2022) até publicações agendadas pra 2026.

por mateus v.há 1 dia3 min#safety#interpretability

Interpretability: a Anthropic abrindo a caixa-preta dos LLMs pra entender o que acontece dentro

PESQUISA

Anthropicde olho

Anthropic estrutura time de Economic Research pra medir o impacto real da IA na economia

A Anthropic tem um time dedicado de Economic Research que estuda como a IA tá remodelando trabalho, produtividade e oportunidade econômica. O carro-chefe é o Anthropic Economic Index, que rastreia uso real do Claude em todo setor da economia. Últimos relatórios mostram automação diretiva subindo de 27% pra 39% das conversas desde dezembro de 2024, com empresas automatizando bem mais que consumidores.

há 1 dia3 min#economic_impact#productivity

Anthropic estrutura time de Economic Research pra medir o impacto real da IA na economia

PESQUISA

Anthropicde olho

Alignment na Anthropic: o time que testa se os modelos vão continuar honestos quando ficarem mais fortes

A Anthropic mantém uma página-hub do time de Alignment, que cuida de manter os modelos úteis, honestos e inofensivos mesmo quando a capacidade cresce. A página lista linhas de pesquisa (auditoria de objetivos ocultos, alignment faking, reward tampering, character training) e um histórico de publicações que vai de 2024 até 2026, incluindo Constitutional Classifiers e data poisoning em LLMs.

há 1 dia4 min#safety#llm

Alignment na Anthropic: o time que testa se os modelos vão continuar honestos quando ficarem mais fortes

FERRAMENTAS

AWSde olho

Transcrição multilíngue barata em escala: Parakeet-TDT rodando no AWS Batch

A AWS publicou um guia pra quem quer fugir do custo de ASR gerenciado: roda o NVIDIA Parakeet-TDT-0.6B-v3 em AWS Batch com GPU, dispara via S3 + EventBridge e usa Spot pra cortar até 90%. Pipeline event-driven escala do zero, cobre 25 idiomas europeus (português incluso) e sai por frações de centavo por hora de áudio.

por mateus v.há 1 dia4 min#voice#aws

Transcrição multilíngue barata em escala: Parakeet-TDT rodando no AWS Batch

FERRAMENTAS

NVIDIAde olho

NVIDIA lança RTX PRO 4500 Blackwell Server Edition e vGPU 20 pra escalar data center com IA

A NVIDIA anunciou a RTX PRO 4500 Blackwell Server Edition, GPU de servidor com 32 GB GDDR7 e suporte a duas instâncias MIG, junto com o software vGPU 20. A combinação promete quase 1.9x mais aceleração em workloads gráficos vs L4 e abre espaço pra rodar desktop virtual, IA leve e simulação CUDA no mesmo hardware físico.

por mateus v.há 1 dia4 min#blackwell#gpu

NVIDIA lança RTX PRO 4500 Blackwell Server Edition e vGPU 20 pra escalar data center com IA

PESQUISA

NVIDIAde olho

NVIDIA Megatron ganha suporte a Muon e outros otimizadores emergentes pra treino de LLM em escala

A NVIDIA integrou o Muon (MomentUm Orthogonalized by Newton-Schulz) e outros otimizadores de segunda ordem como MOP e REKLS no Megatron Core e no NeMo Megatron Bridge. Resultado: treino do Kimi K2 e Qwen3 30B em GB300 NVL72 com perda mínima de throughput contra o AdamW. A receita junta otimizador distribuído layer-wise e três modos de Newton-Schulz distribuído pra lidar com tensor parallelism.

há 1 dia4 min#llm#optimization

NVIDIA Megatron ganha suporte a Muon e outros otimizadores emergentes pra treino de LLM em escala

PRODUTO

AWSde olho

SageMaker AI ganha recomendações otimizadas de inferência pra IA generativa

A AWS lançou recomendações otimizadas de inferência generativa no Amazon SageMaker AI. Você traz o modelo, define tráfego esperado e escolhe um objetivo (custo, latência ou throughput). O SageMaker filtra configurações, aplica otimizações (speculative decoding, tensor parallelism) e faz benchmark em GPU real via NVIDIA AIPerf, devolvendo configs ranqueadas prontas pra deploy.

por mateus v.há 1 dia4 min#sagemaker#inference

SageMaker AI ganha recomendações otimizadas de inferência pra IA generativa

PRODUTO

AWSde olho

AWS lança managed agent harness no Bedrock AgentCore pra tirar agente do zero em minutos

A AWS anunciou novos recursos no Amazon Bedrock AgentCore pra encurtar o caminho entre ideia e agente rodando. O destaque é o managed agent harness: você declara o agente em 3 chamadas de API, sem código de orquestração. Também entrou uma CLI que cobre prototipagem, deploy e operação no mesmo terminal, além de skills pré-construídas pra assistentes de código como Claude Code, Kiro, Codex e Cursor.

por mateus v.há 1 dia4 min#agents#bedrock

AWS lança managed agent harness no Bedrock AgentCore pra tirar agente do zero em minutos

PRODUTO

Microsoftde olho

Microsoft lança Toolboxes no Foundry: um endpoint MCP único pra todos os tools dos seus agentes

A Microsoft anunciou o Toolbox no Foundry em public preview: jeito de empacotar tools (APIs, MCP servers, connectors, skills) num bundle reusável, com autenticação centralizada e endpoint MCP único que qualquer agente consome. Funciona com Microsoft Agent Framework, LangGraph, GitHub Copilot, Claude Code e qualquer runtime que fale MCP. Foco inicial: parar de refazer fiação de tools em cada agente novo.

por mateus v.há 1 dia4 min#agents#tooling

Microsoft lança Toolboxes no Foundry: um endpoint MCP único pra todos os tools dos seus agentes

FERRAMENTAS

Microsoftraiz

Microsoft fecha o ciclo de agentes: Agent Framework 1.0, Foundry Toolkit no VS Code e hosted agents com sandbox isolada

A Microsoft lançou a v1.0 do Agent Framework (SDK open-source que unifica Semantic Kernel e AutoGen em Python e .NET) junto com GA do Foundry Toolkit pro VS Code, memory gerenciada, Toolbox com MCP/OpenAPI/A2A num endpoint só, hosted agents com sandbox isolada e cold-start abaixo de 100ms, e Observability full GA no Foundry Control Plane. A pegada: cobrir o ciclo do laptop à produção sem você juntar peça de três fornecedores.

por mateus v.há 1 dia7 min#agents#open_source

Microsoft fecha o ciclo de agentes: Agent Framework 1.0, Foundry Toolkit no VS Code e hosted agents com sandbox isolada

FERRAMENTAS

Microsoftde olho

Microsoft Foundry lança hosted agents: sandbox dedicado por sessão, scale-to-zero e filesystem persistente

A Microsoft colocou em public preview os hosted agents no Foundry Agent Service: compute pensado pra agentes de produção, com sandbox isolado por sessão via hypervisor, filesystem que sobrevive a scale-to-zero, identidade por agente (Entra Agent ID) e suporte a qualquer framework (LangGraph, Claude Agent SDK, OpenAI Agents SDK). Deploy num comando: azd deploy.

por mateus v.há 1 dia4 min#agents#coding

Microsoft Foundry lança hosted agents: sandbox dedicado por sessão, scale-to-zero e filesystem persistente

PRODUTO

Google

Google Photos ganha Auto frame: IA generativa reenquadra suas fotos em 3D depois do clique

Google lançou uma nova abordagem de edição no Auto frame do Google Photos: a foto 2D é interpretada como cena 3D, a câmera virtual é reposicionada e a IA generativa preenche o que ficou escondido. Roda em dois estágios (estimativa 3D + latent diffusion), corrige distorção de selfie grande-angular e entrega a versão reenquadrada como segunda opção dentro do Auto frame.

há 1 dia3 min#vision#generative_ai

Google Photos ganha Auto frame: IA generativa reenquadra suas fotos em 3D depois do clique

PESQUISA

Microsoft

AutoAdapt: framework da Microsoft Research automatiza adaptação de LLMs pra domínios específicos

A Microsoft Research apresentou o AutoAdapt, framework end-to-end que automatiza a adaptação de LLMs pra domínios de alto risco como direito, medicina e resposta a incidentes em nuvem. Ele escolhe entre RAG e fine-tuning, planeja pipelines válidos e refina hiperparâmetros respeitando restrições de latência, hardware, privacidade e orçamento. Código liberado em open source.

por mateus v.há 1 dia3 min#llm#domain_adaptation

AutoAdapt: framework da Microsoft Research automatiza adaptação de LLMs pra domínios específicos

PRODUTO

AWS

AWS mostra memória corporativa no Bedrock com Amazon Neptune e Mem0, case da TrendMicro

A AWS publicou arquitetura de referência que combina Amazon Bedrock, Neptune e Mem0 pra dar memória persistente e específica da empresa a agentes de IA. A TrendMicro usou o stack pra construir o Trend's Companion, chatbot que cruza memória curta de conversa com knowledge graph organizacional. Inclui human-in-the-loop pra validar o que entra na base.

há 1 dia3 min#agents#bedrock

AWS mostra memória corporativa no Bedrock com Amazon Neptune e Mem0, case da TrendMicro

PRODUTO

Hugging Face

Gemma 4 VLA rodando local no Jetson Orin Nano Super: tutorial completo

Asier Arranz (NVIDIA) publicou no Hugging Face um tutorial de VLA (Vision-Language-Action) rodando 100% local num Jetson Orin Nano Super de 8 GB. Stack: Parakeet STT → Gemma 4 → webcam (se precisar) → Kokoro TTS. O modelo decide sozinho quando olhar pela câmera pra responder, sem keyword trigger nem lógica hardcoded. Tudo em um script Python só.

há 1 dia4 min#vision#open_source

Gemma 4 VLA rodando local no Jetson Orin Nano Super: tutorial completo

FERRAMENTAS

Googlede olho

Google apresenta TPU 8i e 8t: dois chips especializados pra era dos agentes de IA

O Google anunciou a oitava geração do TPU com dois chips dedicados: o TPU 8i, otimizado pra inferência de agentes de IA autônomos que executam workflows multi-etapas, e o TPU 8t, voltado pra treinar modelos complexos num único pool gigante de memória. A dupla vira o motor da stack full-stack do Google pra escalar IA agêntica.

por mateus v.há 1 dia2 min#tpu#hardware

Google apresenta TPU 8i e 8t: dois chips especializados pra era dos agentes de IA

PRODUTO

OpenAIde olho

OpenAI lança Workspace Agents pra automatizar fluxos repetitivos no ChatGPT

A OpenAI publicou material sobre Workspace Agents, recurso pra times construírem, usarem e escalarem agentes dentro do ChatGPT. Objetivo: automatizar workflows repetitivos, conectar ferramentas e dar agilidade em operações de time. Direcionado pra contas corporativas que querem levar agente pra dentro do dia a dia sem montar infra própria.

há 2 dias2 min#agents#coding

PRODUTO

OpenAI

OpenAI acelera workflows de agentes com WebSockets na Responses API

A OpenAI publicou um mergulho técnico no loop de agente do Codex, mostrando como trocou HTTP por WebSockets e aplicou cache escopado por conexão pra cortar overhead de API e melhorar a latência do modelo. É o tipo de otimização que importa quando o agente faz centenas de chamadas por sessão.

há 2 dias2 min#agents#api

OpenAI acelera workflows de agentes com WebSockets na Responses API

PRODUTO

OpenAIde olho

OpenAI lança workspace agents no ChatGPT pra automatizar fluxos de trabalho

A OpenAI anunciou os workspace agents no ChatGPT: agentes movidos a Codex que rodam na nuvem e automatizam fluxos complexos dentro do ambiente de trabalho. A proposta é deixar times escalarem tarefas entre ferramentas diferentes com controles de segurança, sem precisar montar pipeline próprio de automação.

por mateus v.há 2 dias2 min#agents#coding

OpenAI lança workspace agents no ChatGPT pra automatizar fluxos de trabalho

FERRAMENTAS

OpenAIde olho

OpenAI lança Privacy Filter, modelo open-weight pra detectar e mascarar PII em texto

A OpenAI liberou o Privacy Filter, modelo open-weight que detecta e mascara informação pessoal identificável (PII) em texto. A empresa afirma precisão state-of-the-art na tarefa. É uma peça pra quem precisa higienizar dados antes de mandar pra LLM, treinar modelo próprio ou logar prompts sem vazar dado sensível.

por mateus v.há 2 dias2 min#open_source#safety

OpenAI lança Privacy Filter, modelo open-weight pra detectar e mascarar PII em texto

PESQUISA

Anthropicde olho

Anthropic lança pesquisa mensal sobre impacto econômico da IA com usuários do Claude

A Anthropic anunciou o Economic Index Survey, pesquisa mensal rodada via Anthropic Interviewer com amostra rotativa de usuários do Claude. Objetivo: captar dados qualitativos sobre como as pessoas estão vivendo a transição econômica da IA (tarefas delegadas, ganhos de produtividade, mudanças em contratação) antes que apareçam nos indicadores tradicionais de mercado de trabalho.

por mateus v.há 2 dias3 min#llm#economic_impact

PESQUISA

applede olho🇧🇷 BR

Apple leva pesquisa em ML pro ICLR 2026 no Rio: RNN em escala, SSM com ferramentas e dobradinha com MLX

A Apple desembarca no ICLR 2026, que rola no Rio de Janeiro, com cinco trabalhos de destaque: paralelização de RNNs que destrava treino de 7B parâmetros, uso de ferramentas externas pra State Space Models generalizarem em tarefas longas, modelo multimodal unificado (Manzano), geração 3D a partir de uma foto em menos de 1 segundo (SHARP) e uma nova arquitetura simples pra protein folding (SimpleFold).

por mateus v.há 2 dias5 min#apple#ml_research

PESQUISA

Anthropicde olho

O que 81 mil pessoas contaram pra Anthropic sobre a economia da IA

A Anthropic entrevistou 81 mil usuários do Claude pra entender como a IA tá mexendo com trabalho e renda. Quem atua em funções mais expostas à IA tem mais medo de perder emprego, e o receio é maior entre quem tá começando carreira. Os maiores ganhos de produtividade aparecem nos extremos: profissões bem pagas e mal pagas. Quem sente mais aceleração no trabalho também é quem mais teme substituição.

por mateus v.há 2 dias6 min#economics#job_displacement

Toda a timeline, dia por dia.

quarta-feira · 22 de abr

NVIDIA integra Universal Sparse Tensor ao nvmath-python 0.9.0 e promete até 444x de speedup em SpMV

Anthropic detalha o time de Societal Impacts e a agenda de pesquisa sobre uso real de IA

Interpretability: a Anthropic abrindo a caixa-preta dos LLMs pra entender o que acontece dentro

Anthropic estrutura time de Economic Research pra medir o impacto real da IA na economia

Alignment na Anthropic: o time que testa se os modelos vão continuar honestos quando ficarem mais fortes

Transcrição multilíngue barata em escala: Parakeet-TDT rodando no AWS Batch

NVIDIA lança RTX PRO 4500 Blackwell Server Edition e vGPU 20 pra escalar data center com IA

NVIDIA Megatron ganha suporte a Muon e outros otimizadores emergentes pra treino de LLM em escala

SageMaker AI ganha recomendações otimizadas de inferência pra IA generativa

AWS lança managed agent harness no Bedrock AgentCore pra tirar agente do zero em minutos

Microsoft lança Toolboxes no Foundry: um endpoint MCP único pra todos os tools dos seus agentes

Microsoft fecha o ciclo de agentes: Agent Framework 1.0, Foundry Toolkit no VS Code e hosted agents com sandbox isolada

Microsoft Foundry lança hosted agents: sandbox dedicado por sessão, scale-to-zero e filesystem persistente

Google Photos ganha Auto frame: IA generativa reenquadra suas fotos em 3D depois do clique

AutoAdapt: framework da Microsoft Research automatiza adaptação de LLMs pra domínios específicos

AWS mostra memória corporativa no Bedrock com Amazon Neptune e Mem0, case da TrendMicro

Gemma 4 VLA rodando local no Jetson Orin Nano Super: tutorial completo

Google apresenta TPU 8i e 8t: dois chips especializados pra era dos agentes de IA

OpenAI lança Workspace Agents pra automatizar fluxos repetitivos no ChatGPT

OpenAI acelera workflows de agentes com WebSockets na Responses API

OpenAI lança workspace agents no ChatGPT pra automatizar fluxos de trabalho

OpenAI lança Privacy Filter, modelo open-weight pra detectar e mascarar PII em texto

Anthropic lança pesquisa mensal sobre impacto econômico da IA com usuários do Claude

Apple leva pesquisa em ML pro ICLR 2026 no Rio: RNN em escala, SSM com ferramentas e dobradinha com MLX

O que 81 mil pessoas contaram pra Anthropic sobre a economia da IA