Arquivo · cafecomtech

FERRAMENTAS

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

Tom Aarsen publicou um guia prático mostrando como fazer finetuning de modelos multimodais de embedding no Sentence Transformers. O exemplo usa Qwen3-VL-Embedding-2B pra Visual Document Retrieval e chega a NDCG@10 de 0.947 contra 0.888 do modelo base, batendo até o Qwen3-VL-Embedding-8B (4x maior). Receita completa: dataset, loss, training args, evaluator e trainer.

há 8 dias6 min#multimodal#embeddings

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

PESQUISA

Hugging Facede olho

Ecom-RLVE: ambientes verificáveis e adaptativos pra treinar agentes conversacionais de e-commerce

Pesquisadores estenderam o framework RLVE de puzzles single-turn pra conversas multi-turn com ferramentas em e-commerce. O EcomRLVE-GYM traz 8 ambientes verificáveis (descoberta de produto, substituição, carrinho, devolução, tracking, QA de política, bundle e jornada multi-intent), cada um com geração procedural, currículo de dificuldade de 12 eixos e rewards checados por código. Treinaram Qwen 3 8B com DAPO em 300 steps.

por mateus v.há 8 dias7 min#agents#open_source

Ecom-RLVE: ambientes verificáveis e adaptativos pra treinar agentes conversacionais de e-commerce

TECH

Hugging Faceraiz

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

A Hugging Face publicou uma Skill do Claude Code mais um test harness pra ajudar a portar modelos da biblioteca transformers pro mlx-lm quase na hora em que saem. O post é menos sobre a ferramenta e mais sobre um problema real: agentes de código viraram fábrica de PRs de baixa qualidade em projetos open source grandes, e os mantenedores tão afogados.

por mateus v.há 8 dias5 min#open_source

Toda a timeline, dia por dia.

quinta-feira · 16 de abr

Como treinar e fazer finetuning de embeddings multimodais e rerankers com Sentence Transformers

Ecom-RLVE: ambientes verificáveis e adaptativos pra treinar agentes conversacionais de e-commerce

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm