Apple · cafecomtech

tudo modelos produto ferramentas pesquisa negócios

5 matérias

PESQUISA

Apple👀 de olho

Apple leva pesquisa em ML pro ICLR 2026 no Rio: RNN em escala, SSM com ferramentas e dobradinha com MLX

A Apple desembarca no ICLR 2026, que rola no Rio de Janeiro, com cinco trabalhos de destaque: paralelização de RNNs que destrava treino de 7B parâmetros, uso de ferramentas externas pra State Space Models generalizarem em tarefas longas, modelo multimodal unificado (Manzano), geração 3D a partir de uma foto em menos de 1 segundo (SHARP) e uma nova arquitetura simples pra protein folding (SimpleFold).

nota do editorICLR top-tier no Rio é evento raro, vale a ida mesmo sem inscrição no main conference (workshops e posters costumam ser acessíveis). Pra quem faz ML research no Brasil, oportunidade de networking que não se repete tão cedo.

5 min#apple#ml_research

PESQUISA

Apple

Apple pergunta: LLMs realmente entendem contexto? Novo benchmark diz que nem tanto

Pesquisa da Apple com Georgetown propõe um benchmark pra medir se LLM entende contexto linguístico de verdade. Resultado: modelos densos pré-treinados patinam em features contextuais mais sutis quando comparados a modelos fine-tuned especializados. Quantização 3-bit pós-treino piora ainda mais o desempenho. Paper sai na EACL 2026.

2 min#llm#nlp

PESQUISA

Apple

O que seus logits sabem? (A resposta pode te surpreender)

Pesquisa da Apple mostra que probing (sondagem) nos internos de modelos de visão-linguagem vaza informação que o dono do modelo achava inacessível. Em alguns casos, os top-k logits finais entregam tanto quanto projeções diretas do residual stream completo. Implicação prática: mesmo quem só expõe logits via API pode estar liberando dados irrelevantes pra tarefa que estavam na query original.

2 min#vision#safety

O que seus logits sabem? (A resposta pode te surpreender)

PESQUISA

Apple👀 de olho

Apple leva pesquisa ao ICLR 2026 no Rio: MLX local no M5 Max, MANZANO multimodal e 40+ papers

A Apple desembarca no Rio de Janeiro pra edição 2026 do ICLR (International Conference on Learning Representations), de 23 a 27 de abril, com mais de 40 papers na conferência principal, workshops e duas demos técnicas no estande 204: inferência de LLM local num MacBook Pro M5 Max rodando MLX dentro do Xcode, e o SHARP gerando nuvem de pontos 3D num iPad Pro M5.

nota do editorICLR no Rio é evento pra marcar na agenda de quem faz ML sério no Brasil. Apple levando estande, demo de MLX local no M5 Max e 40+ papers mostra que não é presença figurativa. Vale o deslocamento mesmo pra quem não é acadêmico.

4 min#research#deep_learning

PESQUISA

Apple

MixAtlas: Apple apresenta framework pra otimizar mistura de dados em midtraining multimodal

Pesquisadores da Apple (com Virginia Tech e University of Washington) publicaram o MixAtlas, framework pra otimizar mistura de dados em treinamento multimodal de LLMs. Usa modelos proxy menores e processo gaussiano pra explorar o espaço de mistura a 1/100 do custo do treino full-scale. Resultado: convergência até 3x mais rápida e ganhos de 2-5% em benchmarks, com +10% em ChartQA e +13% em TextVQA. Aceito no workshop NADPFM do ICLR 2026.

2 min#multimodal#llm

MixAtlas: Apple apresenta framework pra otimizar mistura de dados em midtraining multimodal

← anteriorpágina 1 de 1próxima →