Buscar · cafecomtech

16 resultados para "aws"

relevância ↓

PRODUTO

AWS

AWS lança Claude Cowork no Amazon Bedrock pra levar Claude Desktop pra toda a empresa

A AWS anunciou o Claude Cowork no Amazon Bedrock: agora dá pra rodar o Cowork e o Claude Code Desktop via Bedrock, direto ou por um LLM gateway. A ideia é estender o Claude além do time de dev e levar pra qualquer knowledge worker da organização, mantendo dados no ambiente AWS do cliente. Billing consumption-based, sem licença por seat da Anthropic.

há cerca de 15 horas · 2 min#llm

AWS lança Claude Cowork no Amazon Bedrock pra levar Claude Desktop pra toda a empresa

PRODUTO

AWS

AWS libera atribuição granular de custo no Bedrock: agora dá pra ver quem gastou o quê

A AWS anunciou atribuição granular de custo pra inferência no Amazon Bedrock. Agora cada chamada é atrelada ao IAM principal que a fez (user, role, identidade federada), e os custos aparecem no AWS Billing, Cost Explorer e CUR 2.0 sem nada pra gerenciar. Com tags opcionais, dá pra agregar gasto por time, projeto ou tenant. Disponível em todas as regiões comerciais, sem custo adicional.

há 5 dias · 2 min#bedrock

AWS libera atribuição granular de custo no Bedrock: agora dá pra ver quem gastou o quê

PRODUTO

AWS

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

A AWS publicou um guia arquitetural pra busca semântica em vídeo usando Nova Multimodal Embeddings no Bedrock. A solução gera embeddings separados pra visual, áudio e transcrição, combina com metadados via busca híbrida e roteia queries por intenção usando Claude Haiku. No benchmark interno, Recall@5 saltou de 51% pra 90% contra o modo combinado padrão.

há 5 dias · 2 min#embeddings

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

FERRAMENTAS

AWS

AWS acelera inferência de LLM em até 3x com speculative decoding no Trainium2 e vLLM

A AWS publicou benchmarks mostrando que speculative decoding no Trainium2 com vLLM acelera geração de token em até 3x pra workloads decode-heavy. O combo testado: Qwen3-32B como target, Qwen3-1.7B como draft, num_speculative_tokens=7. Resultado depende muito do tipo de prompt: estruturado ganha até 3x, prompt aberto praticamente empata com baseline.

há 7 dias · 2 min#llm

AWS acelera inferência de LLM em até 3x com speculative decoding no Trainium2 e vLLM

FERRAMENTAS

AWS

AWS mostra como montar pedido por voz omnichannel com Bedrock AgentCore e Nova 2 Sonic

A AWS publicou um guia completo pra montar sistema de pedidos por voz multi-canal usando Bedrock AgentCore (plataforma pra rodar agentes de IA com isolamento em microVM) e Nova 2 Sonic, o modelo speech-to-speech da casa. Tem código no GitHub, deploy via CDK e arquitetura separada em frontend, agente e backend. Voz conversa com Lambda, DynamoDB e Location Services via MCP.

há 2 dias · 2 min#agents

AWS mostra como montar pedido por voz omnichannel com Bedrock AgentCore e Nova 2 Sonic

PRODUTO

AWS

AWS mostra como montar try-on virtual e recomendação de moda com Nova Canvas, Rekognition e OpenSearch

A AWS publicou um tutorial completo pra montar uma solução serverless de try-on virtual e recomendação de produtos pra varejo online. A stack combina Amazon Nova Canvas (geração de imagem), Rekognition (visão), Titan Multimodal Embeddings e OpenSearch Serverless pra busca vetorial. Tudo empacotado em SAM, deploy com um comando, e código aberto no GitHub.

há 6 dias · 2 min#multimodal

AWS mostra como montar try-on virtual e recomendação de moda com Nova Canvas, Rekognition e OpenSearch

FERRAMENTAS

AWS

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

A AWS publicou um guia mostrando como usar Model Distillation no Amazon Bedrock pra transferir inteligência de roteamento do Nova Premier (teacher) pro Nova Micro (student) numa pipeline de busca semântica de vídeo. Resultado: 95% menos custo de inferência, metade da latência e qualidade de roteamento equivalente ao Claude 4.5 Haiku.

há 5 dias · 2 min#llm

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

FERRAMENTAS

AWS

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

A AWS anunciou a disponibilidade das instâncias G7e no Amazon SageMaker AI, equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell Server Edition. Cada GPU tem 96 GB de GDDR7, dá pra rodar modelos de 35B num único node (g7e.2xlarge) e chegar a 300B num 8-GPU. Benchmark com Qwen3-32B mostra custo de US$ 0,79 por milhão de tokens de saída, 2,6x mais barato que G6e. Com EAGLE speculative decoding, cai pra US$ 0,41.

há 1 dia · 2 min#aws

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

PRODUTO

AWS

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

A AWS liberou os optimized deployments no SageMaker JumpStart: configurações pré-definidas de deploy pra casos de uso específicos como geração de conteúdo, resumo e Q&A. Em vez de só escolher número de usuários simultâneos, agora dá pra otimizar por custo, throughput ou latência. Disponível pra Llama, Mistral, Qwen, Gemma e outros modelos open.

há 8 dias · 2 min#sagemaker

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

FERRAMENTAS

AWS

ToolSimulator: AWS lança framework pra testar agentes de IA sem chamar API real

A AWS soltou o ToolSimulator, framework dentro do Strands Evals que usa LLM pra simular tool calls de agentes. Em vez de bater em API real (com risco de vazar PII, disparar ações indevidas ou lidar com rate limit), o simulator gera respostas adaptativas, mantém estado entre chamadas e valida schema Pydantic. Disponível hoje via `pip install strands-evals`.

há 1 dia · 2 min#agents

ToolSimulator: AWS lança framework pra testar agentes de IA sem chamar API real

NEGÓCIOS

AWS

Como AWS Marketing cortou montagem de página de 4h pra 10min com agente em Amazon Bedrock

O time TAA (Technology, AI, and Analytics) da AWS Marketing trabalhou com a Gradial pra montar uma solução agentic em cima do Amazon Bedrock. Resultado: montagem de página caiu de até 4 horas pra ~10 minutos (redução de 95%). Validação de SEO, acessibilidade e brand passou a rodar durante a criação, via servidor MCP, em vez de depois.

há 5 dias · 2 min#agents

Como AWS Marketing cortou montagem de página de 4h pra 10min com agente em Amazon Bedrock

FERRAMENTAS

AWS

Spring AI SDK pro Amazon Bedrock AgentCore entra em GA

AWS liberou em GA (Generally Available) o Spring AI AgentCore SDK, biblioteca open source que conecta o Amazon Bedrock AgentCore ao Spring AI via anotações e auto-configuração. Dev Java anota um método com @AgentCoreInvocation e o SDK resolve o contrato de runtime, streaming SSE, health check e rate limiting. Roda no AgentCore Runtime gerenciado ou standalone em EKS/ECS.

há 8 dias · 2 min#agents

Spring AI SDK pro Amazon Bedrock AgentCore entra em GA

PRODUTO

AWS

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

A AWS detalhou como os checks de Automated Reasoning no Amazon Bedrock Guardrails trocam validação probabilística por verificação matemática formal. A ideia: em vez de rodar um LLM-como-juiz avaliando outro LLM, o sistema prova logicamente se a saída bate com as regras definidas. Casos citados vão de Amazon Logistics (revisão de 8h pra minutos) a Lucid Motors com PwC (forecast de semanas pra menos de 1 minuto) e FETG com redução de 80% no setup de regras.

há 6 dias · 2 min#safety

Como os checks de Automated Reasoning no Amazon Bedrock mudam o jogo de compliance em IA generativa

FERRAMENTAS

AWS

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

A AWS publicou um guia combinando DVC (Data Version Control), Amazon SageMaker AI e SageMaker AI MLflow Apps pra resolver rastreabilidade de modelos em produção. Dois padrões acompanham notebooks prontos: lineage em nível de dataset e em nível de registro individual, esse último pensado pra compliance em saúde e finance. Tudo rodável em conta AWS própria.

há cerca de 18 horas · 2 min#mlops

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

PRODUTO

AWS

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand

AWS mostra dois caminhos pra fine-tunar o Amazon Nova Micro em dialeto SQL próprio, com deploy serverless no Bedrock e cobrança por token. No exemplo, 22 mil queries/mês saíram por US$ 0,80 — bem abaixo de rodar um modelo customizado em infra dedicada. Um caminho passa pelo Bedrock gerenciado, outro pelo SageMaker AI com controle fino de hiperparâmetros.

há 6 dias · 2 min#llm

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand

PRODUTO

AWS

Amazon QuickSight ganha sheet tooltips: tooltips customizados com gráficos, KPIs e imagens

A AWS anunciou os sheet tooltips no Amazon QuickSight. Autores de dashboard agora montam tooltips customizados em layout free-form, misturando gráficos, KPIs, texto e imagens num único tooltip que atualiza dinâmico quando o leitor passa o mouse sobre pontos de dados. Funciona com a maioria dos tipos de visual e o mesmo tooltip pode ser reusado em múltiplos gráficos.

há 7 dias · 2 min#aws

O que você procura?

16 resultados para "aws"