關於 EarScribe

EarScribe 是一款靜態網頁應用程式，透過 Transformers.js 以及 WebGPU / WebAssembly 執行環境，直接在瀏覽器中執行 OpenAI 的 Whisper 語音辨識模型。

沒有任何後端會接觸你的音訊。Cloudflare Pages 託管僅提供靜態 HTML、JS 和 CSS 檔案。Whisper 模型權重在首次使用時從 Hugging Face CDN 下載，並由瀏覽器快取。

基於 Transformers.js、ONNX Runtime Web 和 OpenAI 開源 Whisper 模型建構。

免費無限制音訊轉文字——常見問題

EarScribe 真的 100% 免費且沒有限制嗎？

是的——100% 免費、無限使用、無需註冊、無需登入。沒有付費方案、不需要信用卡、不按分鐘收費，也沒有每日或每月配額。Whisper 語音轉文字模型在你自己的硬體上執行，無需承擔任何雲端運算費用。真正無附加條件的免費音訊轉文字。

我的音訊安全私密嗎？

完全私密。EarScribe 是一款本機優先的音訊轉文字工具：你的音訊檔案永遠不會離開你的裝置，也不會上傳到任何伺服器。無需帳號意味著不收集任何關於你的資料。模型下載完成後，你甚至可以離線使用。

我的音訊會被上傳嗎？

不會。音訊轉文字完全在本機進行——音訊在你的裝置上解碼，並由執行在 Web Worker 中的 Whisper 模型處理。沒有任何內容會被傳送到伺服器。

為什麼第一次執行比較慢？

首次選擇模型時，瀏覽器需要下載模型檔案（根據大小不同，約 80 MB 至 800 MB）。之後模型會被快取並重複使用，無需再次下載。

支援哪些語言？

透過 Whisper 支援 99 種語言的音訊轉文字。語言會自動偵測，無需手動選擇。

可以轉錄影片嗎？

暫不支援直接轉錄影片。如需將影片音訊轉文字，請先擷取音訊（任何能匯出 MP3 或 WAV 的工具均可），然後將音訊檔案拖入此處。

離線可以使用嗎？

模型下載完成後可以離線使用。首次需要載入頁面，之後的音訊轉文字無需網路連線即可進行。

如何免費將 MP3 轉換為文字？

將 MP3 拖入 EarScribe 即可免費完成 MP3 轉文字。檔案在瀏覽器中解碼，Whisper 在本機轉錄，你可以複製轉錄結果，或將 MP3 轉文字內容匯出為 SRT、VTT、TXT 或 JSON。無需上傳，無需帳號。

有沒有免費的 Otter.ai 或 Rev 替代方案？

EarScribe 是 Otter.ai、Rev 和 HappyScribe 等雲端轉錄服務的免費替代方案。差別在於：你在自己的裝置上完成運算，音訊永遠不會離開本機，也沒有按分鐘收費或訂閱費。

能從音訊生成 SRT 或 VTT 字幕嗎？

可以。音訊轉文字完成後，點選「匯出」選擇 .srt 或 .vtt。字幕時間軸來自 Whisper 輸出的時間戳記，與音訊精準對齊，無需手動調整。

這個工具在瀏覽器中執行 OpenAI Whisper 嗎？

是的——EarScribe 透過 Transformers.js 在瀏覽器中執行 Whisper（Tiny、Base、Small 和 Large v3 Turbo），優先使用 WebGPU，不可用時自動回退至 WebAssembly。