Buscar · cafecomtech

6 resultados para "multimodal"

relevância ↓

PRODUTO

AWS

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

A AWS publicou um guia arquitetural pra busca semântica em vídeo usando Nova Multimodal Embeddings no Bedrock. A solução gera embeddings separados pra visual, áudio e transcrição, combina com metadados via busca híbrida e roteia queries por intenção usando Claude Haiku. No benchmark interno, Recall@5 saltou de 51% pra 90% contra o modo combinado padrão.

há 5 dias · 2 min#embeddings

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

FERRAMENTAS

Hugging Face

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

Tom Aarsen publicou um guia prático mostrando como fazer finetuning de modelos multimodais de embedding no Sentence Transformers. O exemplo usa Qwen3-VL-Embedding-2B pra Visual Document Retrieval e chega a NDCG@10 de 0.947 contra 0.888 do modelo base, batendo até o Qwen3-VL-Embedding-8B (4x maior). Receita completa: dataset, loss, training args, evaluator e trainer.

há 6 dias · 2 min#multimodal

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

PRODUTO

NVIDIA

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

A NVIDIA publicou um guia prático pra rodar LLMs e VLMs grandes nos Jetson Orin Nano, Orin NX e Thor sem estourar a RAM unificada. O texto mapeia 5 camadas de otimização — do BSP até quantização — com ganhos medidos de até 10–12 GB. Inclui caso real do Reachy Mini rodando pipeline multimodal completo em 8 GB.

há 1 dia · 2 min#jetson

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

PRODUTO

AWS

AWS mostra como montar try-on virtual e recomendação de moda com Nova Canvas, Rekognition e OpenSearch

A AWS publicou um tutorial completo pra montar uma solução serverless de try-on virtual e recomendação de produtos pra varejo online. A stack combina Amazon Nova Canvas (geração de imagem), Rekognition (visão), Titan Multimodal Embeddings e OpenSearch Serverless pra busca vetorial. Tudo empacotado em SAM, deploy com um comando, e código aberto no GitHub.

há 6 dias · 2 min#multimodal

AWS mostra como montar try-on virtual e recomendação de moda com Nova Canvas, Rekognition e OpenSearch

FERRAMENTAS

AWS

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

A AWS publicou um guia mostrando como usar Model Distillation no Amazon Bedrock pra transferir inteligência de roteamento do Nova Premier (teacher) pro Nova Micro (student) numa pipeline de busca semântica de vídeo. Resultado: 95% menos custo de inferência, metade da latência e qualidade de roteamento equivalente ao Claude 4.5 Haiku.

há 5 dias · 2 min#llm

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

MODELOS

Anthropic

Anthropic lança Claude Opus 4.7

Opus 4.7 chegou com foco em engenharia de software avançada e tarefas longas de agente. Ganhos fortes em coding (Cursor reportou 70% vs 58% do 4.6), visão em alta resolução (até 2.576px) e novo nível de esforço xhigh. Preço mantido: US$5/M input, US$25/M output. Disponível na API, Bedrock, Vertex AI e Microsoft Foundry.

há 6 dias · 2 min#llm

O que você procura?

6 resultados para "multimodal"

AWS mostra como montar busca semântica em vídeo com Nova Multimodal Embeddings no Bedrock

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

Como espremer memória no NVIDIA Jetson pra rodar modelos maiores na borda

AWS mostra como montar try-on virtual e recomendação de moda com Nova Canvas, Rekognition e OpenSearch

AWS mostra como destilar Nova Premier em Nova Micro pra cortar 95% do custo de roteamento em busca de vídeo

Anthropic lança Claude Opus 4.7