Acerca de EarScribe

EarScribe es una aplicación web estática que ejecuta los modelos de reconocimiento de voz Whisper de OpenAI directamente en tu navegador usando Transformers.js y los runtimes WebGPU / WebAssembly.

No hay ningún servidor que toque tu audio. El servidor de Cloudflare Pages solo sirve el HTML, JS y CSS estáticos. Los pesos del modelo Whisper se obtienen desde la CDN de Hugging Face en el primer uso y los almacena en caché tu navegador.

Construido sobre Transformers.js, ONNX Runtime Web y los modelos Whisper de código abierto de OpenAI.

Audio a texto gratis e ilimitado — Preguntas frecuentes

¿EarScribe es realmente 100% gratis sin límites?

Sí — 100% gratis, ilimitado, sin registro ni inicio de sesión. No hay niveles de pago, ni tarjeta de crédito, ni tarifas por minuto, ni cuotas diarias o mensuales. El modelo de voz a texto Whisper se ejecuta en tu propio hardware, así que no hay costes de cómputo en la nube que repercutir. Audio a texto gratis sin ningún tipo de condición.

¿Mi audio es privado y seguro?

Completamente privado. EarScribe es un conversor de audio a texto que funciona en local: tu archivo de audio nunca sale de tu dispositivo y no se sube a ningún servidor. Sin cuenta, sin datos tuyos recopilados. Incluso puedes usarlo sin conexión una vez descargado el modelo.

¿Se sube mi audio a algún lugar?

No. La conversión de audio a texto ocurre íntegramente en local — el audio se decodifica en tu dispositivo y se pasa a un modelo Whisper que se ejecuta en un Web Worker. No se envía nada a ningún servidor.

¿Por qué la primera ejecución es lenta?

La primera vez que seleccionas un modelo para audio a texto, tu navegador lo descarga (entre 80 MB y 800 MB según el tamaño). A partir de ahí, el modelo de audio a texto queda en caché y se reutiliza — sin necesidad de volver a descargarlo.

¿Qué idiomas admite?

La conversión de audio a texto admite 99 idiomas gracias a Whisper. El idioma se detecta automáticamente — no necesitas elegir ninguno.

¿Puedo transcribir un vídeo?

No directamente. Para extraer texto de un vídeo, extrae primero el audio (cualquier herramienta que genere MP3 o WAV sirve) y arrástralo aquí.

¿Funciona sin conexión?

Una vez descargado el modelo, sí — el audio a texto funciona sin conexión. La página en sí necesita cargarse primero, pero las siguientes transcripciones funcionan sin internet.

¿Cómo convierto un MP3 a texto gratis?

Arrastra el MP3 a EarScribe para convertir MP3 a texto de forma gratuita. El archivo se decodifica en tu navegador, Whisper lo transcribe localmente y puedes copiar el resultado o exportar tu MP3 a texto en formato SRT, VTT, TXT o JSON. No hay paso de subida ni cuenta requerida.

¿Es una alternativa gratuita a Otter.ai o Rev?

EarScribe es una alternativa gratuita de audio a texto a servicios de transcripción en la nube como Otter.ai, Rev y HappyScribe. La diferencia: tú haces el procesamiento en tu propio equipo para obtener voz a texto gratis, pero el audio nunca lo abandona y no hay tarifas por minuto ni suscripciones.

¿Puedo generar subtítulos SRT o VTT desde audio?

Sí. Tras convertir el audio a texto, haz clic en Exportar → .srt o .vtt. El tiempo de los subtítulos proviene de las marcas de tiempo de Whisper, por lo que se sincronizan con el texto sin necesidad de ajuste manual.

¿Ejecuta OpenAI Whisper en el navegador?

Sí — EarScribe ejecuta audio a texto gratis mediante Whisper (Tiny, Base, Small y Large v3 Turbo) directamente en el navegador a través de Transformers.js en WebGPU, con retroceso a WebAssembly cuando no está disponible.