PRODUTO
Google
Google acoplou o que chama de Personal Intelligence ao Nano Banana 2: o Gemini puxa contexto dos seus apps Google e da biblioteca do Google Photos pra gerar imagens com você e família sem upload manual nem prompt gigante. Rollout em dias pros assinantes Google AI Plus, Pro e Ultra nos EUA.
há 6 dias · 2 min#multimodal PRODUTO
Google
Google soltou o Gemini 3.1 Flash TTS, novo modelo de text-to-speech com audio tags que deixam você controlar estilo vocal, ritmo e entonação via comandos em linguagem natural. Roda em 70+ idiomas, tem diálogo multi-speaker nativo, score Elo 1.211 no leaderboard da Artificial Analysis e marca d'água SynthID em todo áudio gerado. Já tá disponível no AI Studio, Vertex AI e Google Vids.
PRODUTO
Google
O Google liberou o Skills no Chrome, feature que deixa salvar, reusar e remixar prompts do Gemini direto no navegador. Roda com / ou +, aplica na aba atual (e nas que você selecionar) e já vem com uma biblioteca pronta pra tarefas comuns. Disponível no Gemini in Chrome desktop a partir de hoje.
PESQUISA
Hugging Face
IBM Research soltou o VAKRA, benchmark executável com 8.000+ APIs locais em 62 domínios pra medir se agentes de IA dão conta de workflows multi-step de verdade. Spoiler: dão mal. O post abre os 4 tipos de tarefa, o pipeline de avaliação em cascata e análise detalhada de onde modelos como GPT-OSS-120B, Gemini-3-flash-preview e Claude-Sonnet-4-5 quebram.
MODELOS
NVIDIA
A NVIDIA jogou o Ising, primeira família aberta de modelos de IA pra processadores quânticos. Vem em dois domínios: Ising Calibration (VLM de 35B parâmetros pra calibrar QPU) e Ising Decoding (CNNs 3D pra correção de erro em tempo real). O modelo de calibração bate Gemini 3.1 Pro, Claude Opus 4.6 e GPT 5.4 no novo benchmark QCalEval. Pesos, datasets e framework de treino abertos no Hugging Face.
TECH
Google
O Google juntou num único post as ferramentas que quer empurrar pra temporada de viagem: AI Mode com Canvas montando roteiro, rastreamento de preço de hotel individual, reserva de restaurante via agente, Ask Maps pra explorar destino e Google Wallet com ID digital em aeroporto. Maioria das features é US-only, algumas expandem pra UK, Canadá, Índia e Austrália.
há 5 dias · 2 min#google_products PRODUTO
Google
Google anunciou três features agênticas no Ads Advisor, o agente de IA dentro do Google Ads: troubleshooting proativo de violações de política, monitoramento 24/7 de segurança da conta e certificações instantâneas via Gemini. Lançamento gradual nos próximos meses, disponível em contas em inglês globalmente.
há cerca de 20 horas · 2 min#agents FERRAMENTAS
Hugging Face
Tom Aarsen publicou um guia prático mostrando como fazer finetuning de modelos multimodais de embedding no Sentence Transformers. O exemplo usa Qwen3-VL-Embedding-2B pra Visual Document Retrieval e chega a NDCG@10 de 0.947 contra 0.888 do modelo base, batendo até o Qwen3-VL-Embedding-8B (4x maior). Receita completa: dataset, loss, training args, evaluator e trainer.
há 6 dias · 2 min#multimodal