Buscar · cafecomtech

4 resultados para "sagemaker"

relevância ↓

FERRAMENTAS

AWS

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

A AWS publicou um guia combinando DVC (Data Version Control), Amazon SageMaker AI e SageMaker AI MLflow Apps pra resolver rastreabilidade de modelos em produção. Dois padrões acompanham notebooks prontos: lineage em nível de dataset e em nível de registro individual, esse último pensado pra compliance em saúde e finance. Tudo rodável em conta AWS própria.

há cerca de 18 horas · 2 min#mlops

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

FERRAMENTAS

AWS

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

A AWS anunciou a disponibilidade das instâncias G7e no Amazon SageMaker AI, equipadas com GPUs NVIDIA RTX PRO 6000 Blackwell Server Edition. Cada GPU tem 96 GB de GDDR7, dá pra rodar modelos de 35B num único node (g7e.2xlarge) e chegar a 300B num 8-GPU. Benchmark com Qwen3-32B mostra custo de US$ 0,79 por milhão de tokens de saída, 2,6x mais barato que G6e. Com EAGLE speculative decoding, cai pra US$ 0,41.

há 1 dia · 2 min#aws

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

PRODUTO

AWS

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

A AWS liberou os optimized deployments no SageMaker JumpStart: configurações pré-definidas de deploy pra casos de uso específicos como geração de conteúdo, resumo e Q&A. Em vez de só escolher número de usuários simultâneos, agora dá pra otimizar por custo, throughput ou latência. Disponível pra Llama, Mistral, Qwen, Gemma e outros modelos open.

há 8 dias · 2 min#sagemaker

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

PRODUTO

AWS

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand

AWS mostra dois caminhos pra fine-tunar o Amazon Nova Micro em dialeto SQL próprio, com deploy serverless no Bedrock e cobrança por token. No exemplo, 22 mil queries/mês saíram por US$ 0,80 — bem abaixo de rodar um modelo customizado em infra dedicada. Um caminho passa pelo Bedrock gerenciado, outro pelo SageMaker AI com controle fino de hiperparâmetros.

há 6 dias · 2 min#llm

O que você procura?

4 resultados para "sagemaker"

Lineage ponta a ponta com DVC e SageMaker AI MLflow Apps

AWS libera G7e no SageMaker AI com GPU Blackwell RTX PRO 6000 e corta custo de inferência em até 2,6x

AWS lança deploys otimizados por caso de uso no SageMaker JumpStart

Text-to-SQL customizado barato: fine-tune de Nova Micro no Bedrock com inferência on-demand