arquivo

Toda a timeline, dia por dia.

Navega pelo calendário ou filtra por período / empresa. A gente nunca apaga.

matérias publicadas por dia · 2026

2026

jan

fev

mar

abr

mai

jun

jul

ago

set

out

nov

dez

menos

maistotal · 10 matérias em 2026

10 matérias nos últimos 2130 dias · Apple

Ontem

3 matérias

PESQUISA

apple

StereoFoley: Apple apresenta geração de áudio estéreo com consciência de objetos a partir de vídeo

A Apple publicou no ICASSP o StereoFoley, framework que gera áudio estéreo a 48 kHz a partir de vídeo, com sincronização temporal e posicionamento espacial alinhado aos objetos em cena. Os autores treinam um modelo base estado-da-arte e resolvem a falta de dataset estéreo com um pipeline sintético de panning dinâmico e controle de loudness por distância.

há 1 dia2 min#audio#multimodal

StereoFoley: Apple apresenta geração de áudio estéreo com consciência de objetos a partir de vídeo

sexta-feira · 24 de abr

1 matéria

PESQUISA

apple

Apple apresenta método que gera movimento longo e realista sem sintetizar vídeo inteiro

Pesquisadores da Apple e do CompVis (LMU Munique) publicaram no CVPR 2026 um paper que modela dinâmica de cena operando direto num embedding de movimento de longo prazo, em vez de gerar vídeo frame a frame. Compressão temporal de 64x e um modelo de flow-matching condicional entregam geração de movimento orientada por texto ou 'pokes' espaciais, superando modelos de vídeo SOTA e abordagens especializadas.

há 5 dias2 min#vision#motion_embeddings

Apple apresenta método que gera movimento longo e realista sem sintetizar vídeo inteiro

quinta-feira · 23 de abr

1 matéria

PESQUISA

applede olho

ParaRNN: Apple destrava treino paralelo de RNNs não-lineares e escala pra 7B parâmetros

Pesquisa da Apple aceita como Oral no ICLR 2026 resolve o gargalo clássico das RNNs: treinar em paralelo. Usando o método de Newton pra linearizar a recorrência, o framework ParaRNN atinge speedup de 665× no treino sequencial e viabiliza, pela primeira vez, RNNs clássicas (GRU/LSTM adaptadas) de 7B parâmetros com perplexidade competitiva com transformers e Mamba2. Código aberto.

por mateus v.há 6 dias4 min#llm

quarta-feira · 22 de abr

1 matéria

PESQUISA

applede olho🇧🇷 BR

Apple leva pesquisa em ML pro ICLR 2026 no Rio: RNN em escala, SSM com ferramentas e dobradinha com MLX

A Apple desembarca no ICLR 2026, que rola no Rio de Janeiro, com cinco trabalhos de destaque: paralelização de RNNs que destrava treino de 7B parâmetros, uso de ferramentas externas pra State Space Models generalizarem em tarefas longas, modelo multimodal unificado (Manzano), geração 3D a partir de uma foto em menos de 1 segundo (SHARP) e uma nova arquitetura simples pra protein folding (SimpleFold).

por mateus v.há 7 dias

terça-feira · 21 de abr

1 matéria

PESQUISA

apple

Apple pergunta: LLMs realmente entendem contexto? Novo benchmark diz que nem tanto

Pesquisa da Apple com Georgetown propõe um benchmark pra medir se LLM entende contexto linguístico de verdade. Resultado: modelos densos pré-treinados patinam em features contextuais mais sutis quando comparados a modelos fine-tuned especializados. Quantização 3-bit pós-treino piora ainda mais o desempenho. Paper sai na EACL 2026.

há 8 dias2 min#llm#nlp

Apple pergunta: LLMs realmente entendem contexto? Novo benchmark diz que nem tanto

segunda-feira · 20 de abr

1 matéria

PESQUISA

apple

O que seus logits sabem? (A resposta pode te surpreender)

Pesquisa da Apple mostra que probing (sondagem) nos internos de modelos de visão-linguagem vaza informação que o dono do modelo achava inacessível. Em alguns casos, os top-k logits finais entregam tanto quanto projeções diretas do residual stream completo. Implicação prática: mesmo quem só expõe logits via API pode estar liberando dados irrelevantes pra tarefa que estavam na query original.

há 9 dias2 min#vision#safety

O que seus logits sabem? (A resposta pode te surpreender)

sexta-feira · 17 de abr

1 matéria

PESQUISA

applede olho🇧🇷 BR

Apple leva pesquisa ao ICLR 2026 no Rio: MLX local no M5 Max, MANZANO multimodal e 40+ papers

A Apple desembarca no Rio de Janeiro pra edição 2026 do ICLR (International Conference on Learning Representations), de 23 a 27 de abril, com mais de 40 papers na conferência principal, workshops e duas demos técnicas no estande 204: inferência de LLM local num MacBook Pro M5 Max rodando MLX dentro do Xcode, e o SHARP gerando nuvem de pontos 3D num iPad Pro M5.

por mateus v.há 12 dias4 min

quinta-feira · 16 de abr

1 matéria

PESQUISA

apple

MixAtlas: Apple apresenta framework pra otimizar mistura de dados em midtraining multimodal

Pesquisadores da Apple (com Virginia Tech e University of Washington) publicaram o MixAtlas, framework pra otimizar mistura de dados em treinamento multimodal de LLMs. Usa modelos proxy menores e processo gaussiano pra explorar o espaço de mistura a 1/100 do custo do treino full-scale. Resultado: convergência até 3x mais rápida e ganhos de 2-5% em benchmarks, com +10% em ChartQA e +13% em TextVQA. Aceito no workshop NADPFM do ICLR 2026.

há 13 dias2 min#multimodal#llm

MixAtlas: Apple apresenta framework pra otimizar mistura de dados em midtraining multimodal

← carregar mais antigas (próximos 30 dias)

Toda a timeline, dia por dia.

Ontem

StereoFoley: Apple apresenta geração de áudio estéreo com consciência de objetos a partir de vídeo

sexta-feira · 24 de abr

Apple apresenta método que gera movimento longo e realista sem sintetizar vídeo inteiro

quinta-feira · 23 de abr

ParaRNN: Apple destrava treino paralelo de RNNs não-lineares e escala pra 7B parâmetros

quarta-feira · 22 de abr

Apple leva pesquisa em ML pro ICLR 2026 no Rio: RNN em escala, SSM com ferramentas e dobradinha com MLX

terça-feira · 21 de abr

Apple pergunta: LLMs realmente entendem contexto? Novo benchmark diz que nem tanto

segunda-feira · 20 de abr

O que seus logits sabem? (A resposta pode te surpreender)

sexta-feira · 17 de abr

Apple leva pesquisa ao ICLR 2026 no Rio: MLX local no M5 Max, MANZANO multimodal e 40+ papers

quinta-feira · 16 de abr

MixAtlas: Apple apresenta framework pra otimizar mistura de dados em midtraining multimodal

Apple investiga por que modelos de difusão condicional conseguem (às vezes) generalizar composicionalmente

LaDiR: pesquisa da Apple usa difusão latente pra melhorar raciocínio de LLMs