A xAI anunciou duas APIs de áudio avulsas: Grok Speech to Text (STT) e Grok Text to Speech (TTS). Rodam no mesmo stack que sustenta o Grok Voice, os veículos Tesla e o atendimento ao cliente da Starlink. A jogada abre pra devs o motor de áudio que antes ficava trancado dentro dos produtos do ecossistema Musk.
A xAI anunciou duas APIs de áudio standalone: Grok Speech to Text (STT) e Grok Text to Speech (TTS).
Ambas rodam no mesmo stack que já sustenta três produtos em produção:
Aqui a leitura é direta: a xAI tá empacotando como API o que já provou rodar em escala no ecossistema Musk. Não é um modelo novo de laboratório, é infra batida em produção virando produto pra dev.
O post de anúncio não traz números de latência, preço, idiomas suportados nem limites de uso. Quem avalia alternativa a ElevenLabs, OpenAI Realtime ou Deepgram vai precisar esperar a documentação completa pra comparar.
☕ gostou dessa?
Matérias favoritadas ficam no seu /favoritos e, se você tem o cafecomtech instalado, disponíveis offline — no metrô, no avião, na fila do café.
☕ comentários · 0