Buscar · cafecomtech

15 resultados para "claude"

relevância ↓

FERRAMENTAS

Anthropic

Anthropic lança Claude Design pra criar protótipos, slides e mockups direto no chat

A Anthropic anunciou o Claude Design, novo produto do Anthropic Labs que transforma conversa em design polido: protótipos interativos, wireframes, decks e landing pages. Roda no Claude Opus 4.7, exporta pra Canva, PDF, PPTX ou HTML, e faz handoff direto pro Claude Code. Disponível em research preview pros planos Pro, Max, Team e Enterprise.

há 5 dias · 2 min#design

Anthropic lança Claude Design pra criar protótipos, slides e mockups direto no chat

PRODUTO

AWS

AWS lança Claude Cowork no Amazon Bedrock pra levar Claude Desktop pra toda a empresa

A AWS anunciou o Claude Cowork no Amazon Bedrock: agora dá pra rodar o Cowork e o Claude Code Desktop via Bedrock, direto ou por um LLM gateway. A ideia é estender o Claude além do time de dev e levar pra qualquer knowledge worker da organização, mantendo dados no ambiente AWS do cliente. Billing consumption-based, sem licença por seat da Anthropic.

há cerca de 14 horas · 2 min#llm

AWS lança Claude Cowork no Amazon Bedrock pra levar Claude Desktop pra toda a empresa

MODELOS

Anthropic

Anthropic lança Claude Opus 4.7

Opus 4.7 chegou com foco em engenharia de software avançada e tarefas longas de agente. Ganhos fortes em coding (Cursor reportou 70% vs 58% do 4.6), visão em alta resolução (até 2.576px) e novo nível de esforço xhigh. Preço mantido: US$5/M input, US$25/M output. Disponível na API, Bedrock, Vertex AI e Microsoft Foundry.

há 6 dias · 2 min#llm

FERRAMENTAS

NVIDIA

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

A NVIDIA detalhou como o Dynamo tá atacando o gargalo de KV cache em workloads agênticos: padrão write-once-read-many com 85-97% de cache hit em Claude Code, 11.7x de razão leitura/escrita. O post cobre as 3 camadas (frontend multi-protocolo, router KV-aware com priority scheduling, e gerenciamento de cache em 4 tiers) pra fechar a lacuna entre APIs gerenciadas e quem roda modelo open-source em GPU própria.

há 4 dias · 2 min#agents

NVIDIA Dynamo vira agent-native: otimização full-stack pra inferência de agentes de código

TECH

Hugging Face

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

A Hugging Face publicou uma Skill do Claude Code mais um test harness pra ajudar a portar modelos da biblioteca transformers pro mlx-lm quase na hora em que saem. O post é menos sobre a ferramenta e mais sobre um problema real: agentes de código viraram fábrica de PRs de baixa qualidade em projetos open source grandes, e os mantenedores tão afogados.

há 6 dias · 2 min#open_source

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

FERRAMENTAS

AWS

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

A AWS publicou um guia mostrando como usar Model Distillation no Amazon Bedrock pra transferir inteligência de roteamento do Nova Premier (teacher) pro Nova Micro (student) numa pipeline de busca semântica de vídeo. Resultado: 95% menos custo de inferência, metade da latência e qualidade de roteamento equivalente ao Claude 4.5 Haiku.

há 5 dias · 2 min#llm

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

PRODUTO

AWS

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

A AWS publicou um guia arquitetural pra busca semântica em vídeo usando Nova Multimodal Embeddings no Bedrock. A solução gera embeddings separados pra visual, áudio e transcrição, combina com metadados via busca híbrida e roteia queries por intenção usando Claude Haiku. No benchmark interno, Recall@5 saltou de 51% pra 90% contra o modo combinado padrão.

há 5 dias · 2 min#embeddings

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

MODELOS

NVIDIA

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas

A NVIDIA jogou o Ising, primeira família aberta de modelos de IA pra processadores quânticos. Vem em dois domínios: Ising Calibration (VLM de 35B parâmetros pra calibrar QPU) e Ising Decoding (CNNs 3D pra correção de erro em tempo real). O modelo de calibração bate Gemini 3.1 Pro, Claude Opus 4.6 e GPT 5.4 no novo benchmark QCalEval. Pesos, datasets e framework de treino abertos no Hugging Face.

há 8 dias · 2 min#llm

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas

PESQUISA

Hugging Face

Por dentro do VAKRA: raciocínio, uso de ferramentas e modos de falha de agentes

IBM Research soltou o VAKRA, benchmark executável com 8.000+ APIs locais em 62 domínios pra medir se agentes de IA dão conta de workflows multi-step de verdade. Spoiler: dão mal. O post abre os 4 tipos de tarefa, o pipeline de avaliação em cascata e análise detalhada de onde modelos como GPT-OSS-120B, Gemini-3-flash-preview e Claude-Sonnet-4-5 quebram.

há 7 dias · 2 min#agents

Por dentro do VAKRA: raciocínio, uso de ferramentas e modos de falha de agentes

PRODUTO

OpenAI

Codex pra (quase) tudo: OpenAI atualiza app de Mac e Windows com computer use, browser e plugins

A OpenAI atualizou o app Codex pra macOS e Windows com um combo novo: computer use (o modelo controlando o computador), browser embutido, geração de imagem, memória e plugins. O pitch é clássico: acelerar workflow de dev sem trocar de janela o tempo todo.

há 6 dias · 2 min#coding

Codex pra (quase) tudo: OpenAI atualiza app de Mac e Windows com computer use, browser e plugins

PESQUISA

NVIDIA

NVIDIA Red Team mostra ataque de injeção indireta via AGENTS.md no OpenAI Codex

O AI Red Team da NVIDIA demonstrou um ataque de supply chain onde uma dependência Go maliciosa reescreve o arquivo AGENTS.md dentro do container do OpenAI Codex. O agente obedece as instruções injetadas, insere um `time.Sleep(5 * time.Minute)` no `main` e esconde a alteração do reviewer no PR. OpenAI avaliou que não eleva risco além do que dependência comprometida já permite, mas o caso abre uma dimensão nova de risco em workflows agênticos.

há 1 dia · 2 min#agents

NVIDIA Red Team mostra ataque de injeção indireta via AGENTS.md no OpenAI Codex

NEGÓCIOS

AWS

Como AWS Marketing cortou montagem de página de 4h pra 10min com agente em Amazon Bedrock

O time TAA (Technology, AI, and Analytics) da AWS Marketing trabalhou com a Gradial pra montar uma solução agentic em cima do Amazon Bedrock. Resultado: montagem de página caiu de até 4 horas pra ~10 minutos (redução de 95%). Validação de SEO, acessibilidade e brand passou a rodar durante a criação, via servidor MCP, em vez de depois.

há 5 dias · 2 min#agents

Como AWS Marketing cortou montagem de página de 4h pra 10min com agente em Amazon Bedrock

PRODUTO

AWS

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand

AWS mostra dois caminhos pra fine-tunar o Amazon Nova Micro em dialeto SQL próprio, com deploy serverless no Bedrock e cobrança por token. No exemplo, 22 mil queries/mês saíram por US$ 0,80 — bem abaixo de rodar um modelo customizado em infra dedicada. Um caminho passa pelo Bedrock gerenciado, outro pelo SageMaker AI com controle fino de hiperparâmetros.

há 6 dias · 2 min#llm

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand

PRODUTO

AWS

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

A AWS detalhou como os checks de Automated Reasoning no Amazon Bedrock Guardrails trocam validação probabilística por verificação matemática formal. A ideia: em vez de rodar um LLM-como-juiz avaliando outro LLM, o sistema prova logicamente se a saída bate com as regras definidas. Casos citados vão de Amazon Logistics (revisão de 8h pra minutos) a Lucid Motors com PwC (forecast de semanas pra menos de 1 minuto) e FETG com redução de 80% no setup de regras.

há 6 dias · 2 min#safety

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

FERRAMENTAS

Hugging Face

HCompany lança HoloTab, extensão do Chrome que usa o navegador por você

A HCompany soltou o HoloTab, extensão gratuita do Chrome que roda em cima do Holo3, o modelo de computer-use da casa lançado em 31 de março. Você descreve a tarefa e o agente navega, clica e preenche campos como se fosse um humano. Tem também o modo Routines: grava uma vez o que você faz, e depois o HoloTab repete sozinho ou em horário agendado.

há 7 dias · 2 min#agents

O que você procura?

15 resultados para "claude"