Buscar · cafecomtech

4 resultados para "coding"

relevância ↓

MODELOS

Anthropic

Anthropic lança Claude Opus 4.7

Opus 4.7 chegou com foco em engenharia de software avançada e tarefas longas de agente. Ganhos fortes em coding (Cursor reportou 70% vs 58% do 4.6), visão em alta resolução (até 2.576px) e novo nível de esforço xhigh. Preço mantido: US$5/M input, US$25/M output. Disponível na API, Bedrock, Vertex AI e Microsoft Foundry.

há 6 dias · 2 min#llm

FERRAMENTAS

Hugging Face

QIMMA: o leaderboard que valida benchmarks antes de avaliar LLMs em árabe

A TII (Technology Innovation Institute, de Abu Dhabi) lançou o QIMMA قِمّة, leaderboard de LLMs em árabe que inverte a lógica: valida a qualidade do benchmark ANTES de rodar os modelos. São 109 subsets, 52 mil amostras, 7 domínios e uma descoberta desconfortável — até benchmarks consagrados de árabe têm erros sistemáticos que contaminam ranking.

há 1 dia · 2 min#open_source

QIMMA: o leaderboard que valida benchmarks antes de avaliar LLMs em árabe

MODELOS

NVIDIA

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas

A NVIDIA jogou o Ising, primeira família aberta de modelos de IA pra processadores quânticos. Vem em dois domínios: Ising Calibration (VLM de 35B parâmetros pra calibrar QPU) e Ising Decoding (CNNs 3D pra correção de erro em tempo real). O modelo de calibração bate Gemini 3.1 Pro, Claude Opus 4.6 e GPT 5.4 no novo benchmark QCalEval. Pesos, datasets e framework de treino abertos no Hugging Face.

há 8 dias · 2 min#llm

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas

TECH

Hugging Face

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm

A Hugging Face publicou uma Skill do Claude Code mais um test harness pra ajudar a portar modelos da biblioteca transformers pro mlx-lm quase na hora em que saem. O post é menos sobre a ferramenta e mais sobre um problema real: agentes de código viraram fábrica de PRs de baixa qualidade em projetos open source grandes, e os mantenedores tão afogados.

há 6 dias · 2 min#open_source

O que você procura?

4 resultados para "coding"

Anthropic lança Claude Opus 4.7

QIMMA: o leaderboard que valida benchmarks antes de avaliar LLMs em árabe

NVIDIA lança Ising, primeira família de modelos abertos de IA pra construir computadores quânticos tolerantes a falhas

O PR que você teria aberto sozinho: Hugging Face lança Skill pra portar modelos de transformers pro mlx-lm