EarScribe

关于 EarScribe

EarScribe 是一款静态网页应用,通过 Transformers.js 以及 WebGPU / WebAssembly 运行时,直接在浏览器中运行 OpenAI 的 Whisper 语音识别模型。

没有任何后端会接触你的音频。Cloudflare Pages 托管仅提供静态 HTML、JS 和 CSS 文件。Whisper 模型权重在首次使用时从 Hugging Face CDN 下载,并由浏览器缓存。

基于 Transformers.js、ONNX Runtime Web 和 OpenAI 开源 Whisper 模型构建。

免费无限制音频转文字——常见问题

EarScribe 真的 100% 免费且没有限制吗?

是的——100% 免费、无限使用、无需注册、无需登录。没有付费套餐、不需要信用卡、不按分钟收费,也没有每日或每月配额。Whisper 语音转文字模型在你自己的硬件上运行,无需承担任何云计算费用。真正无附加条件的免费音频转文字。

我的音频安全私密吗?

完全私密。EarScribe 是一款本地优先的音频转文字工具:你的音频文件永远不会离开你的设备,也不会上传到任何服务器。无需账号意味着不收集任何关于你的数据。模型下载完成后,你甚至可以离线使用。

我的音频会被上传吗?

不会。音频转文字完全在本地进行——音频在你的设备上解码,并由运行在 Web Worker 中的 Whisper 模型处理。没有任何内容会被发送到服务器。

为什么第一次运行比较慢?

首次选择模型时,浏览器需要下载模型文件(根据大小不同,约 80 MB 至 800 MB)。之后模型会被缓存并复用,无需再次下载。

支持哪些语言?

通过 Whisper 支持 99 种语言的音频转文字。语言会自动检测,无需手动选择。

可以转录视频吗?

暂不支持直接转录视频。如需将视频音频转文字,请先提取音频(任何能导出 MP3 或 WAV 的工具均可),然后将音频文件拖入这里。

离线可以使用吗?

模型下载完成后可以离线使用。首次需要加载页面,之后的音频转文字无需联网即可进行。

如何免费将 MP3 转换为文字?

将 MP3 拖入 EarScribe 即可免费完成 MP3 转文字。文件在浏览器中解码,Whisper 在本地转录,你可以复制转录结果,或将 MP3 转文字内容导出为 SRT、VTT、TXT 或 JSON。无需上传,无需账号。

有没有免费的 Otter.ai 或 Rev 替代品?

EarScribe 是 Otter.ai、Rev 和 HappyScribe 等云转录服务的免费替代方案。区别在于:你在自己的设备上完成计算,音频永远不会离开本地,也没有按分钟收费或订阅费。

能从音频生成 SRT 或 VTT 字幕吗?

可以。音频转文字完成后,点击「导出」选择 .srt 或 .vtt。字幕时间轴来自 Whisper 输出的时间戳,与音频精准对齐,无需手动调整。

这个工具在浏览器中运行 OpenAI Whisper 吗?

是的——EarScribe 通过 Transformers.js 在浏览器中运行 Whisper(Tiny、Base、Small 和 Large v3 Turbo),优先使用 WebGPU,不可用时自动回退至 WebAssembly。