關於 EarScribe
EarScribe 是一款靜態網頁應用程式,透過 Transformers.js 以及 WebGPU / WebAssembly 執行環境,直接在瀏覽器中執行 OpenAI 的 Whisper 語音辨識模型。
沒有任何後端會接觸你的音訊。Cloudflare Pages 託管僅提供靜態 HTML、JS 和 CSS 檔案。Whisper 模型權重在首次使用時從 Hugging Face CDN 下載,並由瀏覽器快取。
基於 Transformers.js、ONNX Runtime Web 和 OpenAI 開源 Whisper 模型建構。
免費無限制音訊轉文字——常見問題
EarScribe 真的 100% 免費且沒有限制嗎?
是的——100% 免費、無限使用、無需註冊、無需登入。沒有付費方案、不需要信用卡、不按分鐘收費,也沒有每日或每月配額。Whisper 語音轉文字模型在你自己的硬體上執行,無需承擔任何雲端運算費用。真正無附加條件的免費音訊轉文字。
我的音訊安全私密嗎?
完全私密。EarScribe 是一款本機優先的音訊轉文字工具:你的音訊檔案永遠不會離開你的裝置,也不會上傳到任何伺服器。無需帳號意味著不收集任何關於你的資料。模型下載完成後,你甚至可以離線使用。
我的音訊會被上傳嗎?
不會。音訊轉文字完全在本機進行——音訊在你的裝置上解碼,並由執行在 Web Worker 中的 Whisper 模型處理。沒有任何內容會被傳送到伺服器。
為什麼第一次執行比較慢?
首次選擇模型時,瀏覽器需要下載模型檔案(根據大小不同,約 80 MB 至 800 MB)。之後模型會被快取並重複使用,無需再次下載。
支援哪些語言?
透過 Whisper 支援 99 種語言的音訊轉文字。語言會自動偵測,無需手動選擇。
可以轉錄影片嗎?
暫不支援直接轉錄影片。如需將影片音訊轉文字,請先擷取音訊(任何能匯出 MP3 或 WAV 的工具均可),然後將音訊檔案拖入此處。
離線可以使用嗎?
模型下載完成後可以離線使用。首次需要載入頁面,之後的音訊轉文字無需網路連線即可進行。
如何免費將 MP3 轉換為文字?
將 MP3 拖入 EarScribe 即可免費完成 MP3 轉文字。檔案在瀏覽器中解碼,Whisper 在本機轉錄,你可以複製轉錄結果,或將 MP3 轉文字內容匯出為 SRT、VTT、TXT 或 JSON。無需上傳,無需帳號。
有沒有免費的 Otter.ai 或 Rev 替代方案?
EarScribe 是 Otter.ai、Rev 和 HappyScribe 等雲端轉錄服務的免費替代方案。差別在於:你在自己的裝置上完成運算,音訊永遠不會離開本機,也沒有按分鐘收費或訂閱費。
能從音訊生成 SRT 或 VTT 字幕嗎?
可以。音訊轉文字完成後,點選「匯出」選擇 .srt 或 .vtt。字幕時間軸來自 Whisper 輸出的時間戳記,與音訊精準對齊,無需手動調整。
這個工具在瀏覽器中執行 OpenAI Whisper 嗎?
是的——EarScribe 透過 Transformers.js 在瀏覽器中執行 Whisper(Tiny、Base、Small 和 Large v3 Turbo),優先使用 WebGPU,不可用時自動回退至 WebAssembly。