关于 EarScribe

EarScribe 是一款静态网页应用，通过 Transformers.js 以及 WebGPU / WebAssembly 运行时，直接在浏览器中运行 OpenAI 的 Whisper 语音识别模型。

没有任何后端会接触你的音频。Cloudflare Pages 托管仅提供静态 HTML、JS 和 CSS 文件。Whisper 模型权重在首次使用时从 Hugging Face CDN 下载，并由浏览器缓存。

基于 Transformers.js、ONNX Runtime Web 和 OpenAI 开源 Whisper 模型构建。

免费无限制音频转文字——常见问题

EarScribe 真的 100% 免费且没有限制吗？

是的——100% 免费、无限使用、无需注册、无需登录。没有付费套餐、不需要信用卡、不按分钟收费，也没有每日或每月配额。Whisper 语音转文字模型在你自己的硬件上运行，无需承担任何云计算费用。真正无附加条件的免费音频转文字。

我的音频安全私密吗？

完全私密。EarScribe 是一款本地优先的音频转文字工具：你的音频文件永远不会离开你的设备，也不会上传到任何服务器。无需账号意味着不收集任何关于你的数据。模型下载完成后，你甚至可以离线使用。

我的音频会被上传吗？

不会。音频转文字完全在本地进行——音频在你的设备上解码，并由运行在 Web Worker 中的 Whisper 模型处理。没有任何内容会被发送到服务器。

为什么第一次运行比较慢？

首次选择模型时，浏览器需要下载模型文件（根据大小不同，约 80 MB 至 800 MB）。之后模型会被缓存并复用，无需再次下载。

支持哪些语言？

通过 Whisper 支持 99 种语言的音频转文字。语言会自动检测，无需手动选择。

可以转录视频吗？

暂不支持直接转录视频。如需将视频音频转文字，请先提取音频（任何能导出 MP3 或 WAV 的工具均可），然后将音频文件拖入这里。

离线可以使用吗？

模型下载完成后可以离线使用。首次需要加载页面，之后的音频转文字无需联网即可进行。

如何免费将 MP3 转换为文字？

将 MP3 拖入 EarScribe 即可免费完成 MP3 转文字。文件在浏览器中解码，Whisper 在本地转录，你可以复制转录结果，或将 MP3 转文字内容导出为 SRT、VTT、TXT 或 JSON。无需上传，无需账号。

有没有免费的 Otter.ai 或 Rev 替代品？

EarScribe 是 Otter.ai、Rev 和 HappyScribe 等云转录服务的免费替代方案。区别在于：你在自己的设备上完成计算，音频永远不会离开本地，也没有按分钟收费或订阅费。

能从音频生成 SRT 或 VTT 字幕吗？

可以。音频转文字完成后，点击「导出」选择 .srt 或 .vtt。字幕时间轴来自 Whisper 输出的时间戳，与音频精准对齐，无需手动调整。

这个工具在浏览器中运行 OpenAI Whisper 吗？

是的——EarScribe 通过 Transformers.js 在浏览器中运行 Whisper（Tiny、Base、Small 和 Large v3 Turbo），优先使用 WebGPU，不可用时自动回退至 WebAssembly。