Arquivo · cafecomtech

FERRAMENTAS

AWSde olhodestaque

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

A AWS anunciou a disponibilidade das instâncias G7e no Amazon SageMaker AI, equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell Server Edition. Cada GPU tem 96 GB de GDDR7, dá pra rodar modelos de 35B num único node (g7e.2xlarge) e chegar a 300B num 8-GPU. Benchmark com Qwen3-32B mostra custo de US$ 0,79 por milhão de tokens de saída, 2,6x mais barato que G6e. Com EAGLE speculative decoding, cai pra US$ 0,41.

FERRAMENTAS

AWSde olho

ToolSimulator: AWS lança framework pra testar agentes de IA sem chamar API real

A AWS soltou o ToolSimulator, framework dentro do Strands Evals que usa LLM pra simular tool calls de agentes. Em vez de bater em API real (com risco de vazar PII, disparar ações indevidas ou lidar com rate limit), o simulator gera respostas adaptativas, mantém estado entre chamadas e valida schema Pydantic. Disponível hoje via `pip install strands-evals`.

por mateus v.há 4 dias4 min#agents#tool_testing

ToolSimulator: AWS lança framework pra testar agentes de IA sem chamar API real

FERRAMENTAS

AWS

AWS mostra como montar pedido por voz omnichannel com Bedrock AgentCore e Nova 2 Sonic

A AWS publicou um guia completo pra montar sistema de pedidos por voz multi-canal usando Bedrock AgentCore (plataforma pra rodar agentes de IA com isolamento em microVM) e Nova 2 Sonic, o modelo speech-to-speech da casa. Tem código no GitHub, deploy via CDK e arquitetura separada em frontend, agente e backend. Voz conversa com Lambda, DynamoDB e Location Services via MCP.

por mateus v.há 4 dias3 min#agents#bedrock

Toda a timeline, dia por dia.

segunda-feira · 20 de abr

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

ToolSimulator: AWS lança framework pra testar agentes de IA sem chamar API real

AWS mostra como montar pedido por voz omnichannel com Bedrock AgentCore e Nova 2 Sonic