Sobre o EarScribe
O EarScribe é um app web estático que roda os modelos de reconhecimento de voz Whisper da OpenAI diretamente no seu navegador usando Transformers.js e os runtimes WebGPU / WebAssembly.
Não existe backend que toque no seu áudio. O host do Cloudflare Pages serve apenas os arquivos HTML, JS e CSS estáticos. Os pesos do modelo Whisper são baixados do CDN do Hugging Face no primeiro uso e ficam em cache no seu navegador.
Construído com Transformers.js, ONNX Runtime Web e os modelos Whisper open source da OpenAI.
Áudio para texto ilimitado e grátis — Perguntas frequentes
O EarScribe é mesmo 100% grátis e sem limites?
Sim — 100% grátis, ilimitado, sem cadastro e sem login. Não há planos pagos, cartão de crédito, cobrança por minuto nem cota diária ou mensal. O modelo de voz para texto Whisper roda no seu próprio hardware, então não há custo de computação na nuvem a repassar. Áudio para texto grátis, sem pegadinhas.
Meu áudio é privado e seguro?
Totalmente privado. O EarScribe é um conversor de áudio para texto que funciona localmente: seu arquivo de áudio nunca sai do seu dispositivo e nunca é enviado para nenhum servidor. Sem conta, nenhum dado seu é coletado. Você ainda pode usar offline depois que o modelo for baixado.
Meu áudio é enviado para algum lugar?
Não. A conversão de áudio para texto acontece totalmente em local — o áudio é decodificado no seu dispositivo e passado para um modelo Whisper rodando em um Web Worker. Nada é enviado para um servidor.
Por que a primeira vez é lenta?
Na primeira vez que você escolhe um modelo para converter áudio em texto, seu navegador faz o download (de 80 MB a 800 MB dependendo do tamanho). Depois disso, o modelo fica em cache e é reutilizado — sem precisar baixar de novo.
Quais idiomas são suportados?
A conversão de áudio para texto suporta 99 idiomas via Whisper. O idioma é detectado automaticamente — você não precisa escolher nenhum.
Posso transcrever um vídeo?
Não diretamente. Para converter áudio de vídeo em texto, extraia o áudio primeiro (qualquer ferramenta que gere MP3 ou WAV funciona) e arraste aqui.
Funciona offline?
Depois que o modelo for baixado uma vez, sim — a conversão de áudio para texto funciona offline. A página precisa ser carregada antes, mas as transcrições seguintes funcionam sem internet.
Como converter um MP3 para texto de graça?
Arraste o MP3 para o EarScribe para a conversão grátis de MP3 para texto. O arquivo é decodificado no seu navegador, o Whisper transcreve localmente, e você pode copiar o resultado ou exportar como SRT, VTT, TXT ou JSON. Sem etapa de upload, sem conta necessária.
Existe uma alternativa grátis ao Otter.ai ou Rev?
O EarScribe é uma alternativa grátis de áudio para texto frente a serviços de transcrição na nuvem como Otter.ai, Rev e HappyScribe. A troca: você faz o processamento na sua própria máquina para ter voz para texto grátis, mas o áudio nunca sai dela e não há cobrança por minuto nem assinatura.
Posso gerar legendas SRT ou VTT a partir de um áudio?
Sim. Após a conversão de áudio para texto, clique em Exportar → .srt ou .vtt. Os tempos das legendas vêm dos próprios timestamps do Whisper, então elas ficam sincronizadas com a transcrição sem precisar de ajuste manual.
Isso roda o OpenAI Whisper no navegador?
Sim — o EarScribe converte áudio para texto via Whisper (Tiny, Base, Small e Large v3 Turbo) direto no navegador usando o Transformers.js no WebGPU, com fallback para WebAssembly quando indisponível.