Sobre o EarScribe

O EarScribe é um app web estático que roda os modelos de reconhecimento de voz Whisper da OpenAI diretamente no seu navegador usando Transformers.js e os runtimes WebGPU / WebAssembly.

Não existe backend que toque no seu áudio. O host do Cloudflare Pages serve apenas os arquivos HTML, JS e CSS estáticos. Os pesos do modelo Whisper são baixados do CDN do Hugging Face no primeiro uso e ficam em cache no seu navegador.

Construído com Transformers.js, ONNX Runtime Web e os modelos Whisper open source da OpenAI.

Áudio para texto ilimitado e grátis — Perguntas frequentes

O EarScribe é mesmo 100% grátis e sem limites?

Sim — 100% grátis, ilimitado, sem cadastro e sem login. Não há planos pagos, cartão de crédito, cobrança por minuto nem cota diária ou mensal. O modelo de voz para texto Whisper roda no seu próprio hardware, então não há custo de computação na nuvem a repassar. Áudio para texto grátis, sem pegadinhas.

Meu áudio é privado e seguro?

Totalmente privado. O EarScribe é um conversor de áudio para texto que funciona localmente: seu arquivo de áudio nunca sai do seu dispositivo e nunca é enviado para nenhum servidor. Sem conta, nenhum dado seu é coletado. Você ainda pode usar offline depois que o modelo for baixado.

Meu áudio é enviado para algum lugar?

Não. A conversão de áudio para texto acontece totalmente em local — o áudio é decodificado no seu dispositivo e passado para um modelo Whisper rodando em um Web Worker. Nada é enviado para um servidor.

Por que a primeira vez é lenta?

Na primeira vez que você escolhe um modelo para converter áudio em texto, seu navegador faz o download (de 80 MB a 800 MB dependendo do tamanho). Depois disso, o modelo fica em cache e é reutilizado — sem precisar baixar de novo.

Quais idiomas são suportados?

A conversão de áudio para texto suporta 99 idiomas via Whisper. O idioma é detectado automaticamente — você não precisa escolher nenhum.

Posso transcrever um vídeo?

Não diretamente. Para converter áudio de vídeo em texto, extraia o áudio primeiro (qualquer ferramenta que gere MP3 ou WAV funciona) e arraste aqui.

Funciona offline?

Depois que o modelo for baixado uma vez, sim — a conversão de áudio para texto funciona offline. A página precisa ser carregada antes, mas as transcrições seguintes funcionam sem internet.

Como converter um MP3 para texto de graça?

Arraste o MP3 para o EarScribe para a conversão grátis de MP3 para texto. O arquivo é decodificado no seu navegador, o Whisper transcreve localmente, e você pode copiar o resultado ou exportar como SRT, VTT, TXT ou JSON. Sem etapa de upload, sem conta necessária.

Existe uma alternativa grátis ao Otter.ai ou Rev?

O EarScribe é uma alternativa grátis de áudio para texto frente a serviços de transcrição na nuvem como Otter.ai, Rev e HappyScribe. A troca: você faz o processamento na sua própria máquina para ter voz para texto grátis, mas o áudio nunca sai dela e não há cobrança por minuto nem assinatura.

Posso gerar legendas SRT ou VTT a partir de um áudio?

Sim. Após a conversão de áudio para texto, clique em Exportar → .srt ou .vtt. Os tempos das legendas vêm dos próprios timestamps do Whisper, então elas ficam sincronizadas com a transcrição sem precisar de ajuste manual.

Isso roda o OpenAI Whisper no navegador?

Sim — o EarScribe converte áudio para texto via Whisper (Tiny, Base, Small e Large v3 Turbo) direto no navegador usando o Transformers.js no WebGPU, com fallback para WebAssembly quando indisponível.