Über EarScribe

EarScribe ist eine statische Web-App, die OpenAIs Whisper-Spracherkennungsmodelle direkt im Browser ausführt – mit Transformers.js und den WebGPU- / WebAssembly-Runtimes.

Es gibt kein Backend, das Ihr Audio verarbeitet. Der Cloudflare Pages-Host liefert lediglich das statische HTML, JS und CSS aus. Die Whisper-Modellgewichte werden beim ersten Aufruf von der Hugging Face CDN geladen und vom Browser zwischengespeichert.

Basiert auf Transformers.js, ONNX Runtime Web und den Open-Source-Whisper-Modellen von OpenAI.

Kostenlose, unbegrenzte Audio-zu-Text-Umwandlung – FAQ

Ist EarScribe wirklich 100 % kostenlos und ohne Limits?

Ja – 100 % kostenlos, unbegrenzt, ohne Anmeldung und ohne Login. Es gibt keine kostenpflichtigen Stufen, keine Kreditkarte, keine Minutenpreise und keine täglichen oder monatlichen Kontingente. Das Whisper-Spracherkennungsmodell läuft auf Ihrer eigenen Hardware, sodass keine Cloud-Rechenkosten anfallen. Kostenlose Audio-zu-Text-Umwandlung ohne Bedingungen.

Ist mein Audio privat und sicher?

Vollständig privat. EarScribe ist ein lokal arbeitender Audio-zu-Text-Konverter: Ihre Audiodatei verlässt Ihr Gerät nie und wird auf keinen Server hochgeladen. Kein Konto bedeutet keine Datenerhebung über Sie. Sie können es sogar offline nutzen, sobald das Modell heruntergeladen ist.

Wird mein Audio irgendwo hochgeladen?

Nein. Die kostenlose Audio-zu-Text-Umwandlung erfolgt vollständig lokal – das Audio wird auf Ihrem Gerät dekodiert und einem Whisper-Modell übergeben, das in einem Web Worker läuft. Es wird nichts an einen Server gesendet.

Warum ist der erste Durchlauf langsam?

Beim ersten Auswählen eines Modells lädt Ihr Browser es herunter (80 MB bis 800 MB je nach Größe). Danach wird das kostenlose Audio-zu-Text-Modell zwischengespeichert und wiederverwendet – kein erneuter Download nötig.

Welche Sprachen werden unterstützt?

Die kostenlose Audio-zu-Text-Funktion unterstützt über Whisper 99 Sprachen. Die Sprache wird automatisch erkannt – Sie müssen keine auswählen.

Kann ich ein Video transkribieren?

Nicht direkt. Für Video-Audio-zu-Text extrahieren Sie zunächst das Audio (jedes Tool, das MP3 oder WAV ausgeben kann, funktioniert) und legen es hier ab.

Funktioniert das offline?

Nachdem das Modell einmal heruntergeladen wurde, ja – die kostenlose Audio-zu-Text-Umwandlung funktioniert offline. Die Seite muss zunächst geladen werden, aber nachfolgende Transkriptionen laufen ohne Internetverbindung.

Wie konvertiere ich eine MP3 kostenlos in Text?

Legen Sie die MP3 auf EarScribe ab, um sie kostenlos in Text umzuwandeln. Die Datei wird im Browser dekodiert, Whisper transkribiert sie lokal, und Sie können das Ergebnis kopieren oder als SRT, VTT, TXT oder JSON exportieren. Kein Upload-Schritt, kein Konto erforderlich.

Gibt es eine kostenlose Alternative zu Otter.ai oder Rev?

EarScribe ist eine kostenlose Audio-zu-Text-Alternative zu Cloud-Transkriptionsdiensten wie Otter.ai, Rev und HappyScribe. Der Unterschied: Sie führen die Verarbeitung auf Ihrem eigenen Gerät durch, um kostenlose Spracherkennung zu erhalten – dafür verlässt das Audio es nie und es fallen keine Minutenpreise oder Abonnements an.

Kann ich SRT- oder VTT-Untertitel aus Audio generieren?

Ja. Nach der Audio-zu-Text-Umwandlung auf Exportieren → .srt oder .vtt klicken. Die Cue-Zeiten stammen aus den von Whisper ausgegebenen Zeitstempeln, sodass die Untertitel ohne manuelle Anpassung mit der Ausgabe synchronisiert sind.

Wird OpenAI Whisper im Browser ausgeführt?

Ja – EarScribe führt die kostenlose Audio-zu-Text-Umwandlung über Whisper (Tiny, Base, Small und Large v3 Turbo) direkt im Browser aus, mithilfe von Transformers.js auf WebGPU, mit Rückfall auf WebAssembly, wenn nicht verfügbar.