Giới thiệu EarScribe

EarScribe là ứng dụng web tĩnh chạy các mô hình nhận dạng giọng nói Whisper của OpenAI trực tiếp trong trình duyệt của bạn bằng Transformers.js và runtime WebGPU / WebAssembly.

Không có backend nào xử lý âm thanh của bạn. Máy chủ Cloudflare Pages chỉ phục vụ HTML, JS và CSS tĩnh. Trọng số mô hình Whisper được lấy từ CDN Hugging Face trong lần sử dụng đầu tiên và được lưu trong bộ nhớ đệm của trình duyệt.

Được xây dựng trên Transformers.js, ONNX Runtime Web và các mô hình Whisper mã nguồn mở từ OpenAI.

Chuyển âm thanh thành văn bản miễn phí không giới hạn — FAQ

EarScribe có thực sự miễn phí 100% không giới hạn không?

Có — miễn phí 100%, không giới hạn, không cần đăng ký và đăng nhập. Không có gói trả phí, không có thẻ tín dụng, không có phí theo phút, và không có hạn mức ngày hay tháng. Mô hình Whisper chạy trên phần cứng của bạn, nên không có chi phí điện toán đám mây nào. Chuyển âm thanh thành văn bản miễn phí hoàn toàn.

Âm thanh của tôi có riêng tư và an toàn không?

Hoàn toàn riêng tư. EarScribe là công cụ chuyển âm thanh thành văn bản ưu tiên cục bộ: tệp âm thanh của bạn không bao giờ rời khỏi thiết bị và không bao giờ được tải lên bất kỳ máy chủ nào. Không có tài khoản nghĩa là không có dữ liệu nào được thu thập về bạn. Bạn thậm chí có thể dùng ngoại tuyến sau khi mô hình được tải xuống.

Âm thanh của tôi có bị tải lên đâu không?

Không. Chuyển âm thanh thành văn bản miễn phí diễn ra hoàn toàn cục bộ — âm thanh được giải mã trên thiết bị của bạn và đưa vào mô hình Whisper chạy trong Web Worker. Không có gì được gửi đến máy chủ.

Tại sao lần chạy đầu tiên chậm?

Lần đầu tiên bạn chọn mô hình để chuyển âm thanh thành văn bản, trình duyệt của bạn sẽ tải xuống nó (80 MB đến 800 MB tùy kích thước). Sau đó mô hình được lưu trong bộ nhớ đệm và tái sử dụng — không cần tải lại.

Những ngôn ngữ nào được hỗ trợ?

Chuyển âm thanh thành văn bản miễn phí hỗ trợ 99 ngôn ngữ qua Whisper. Ngôn ngữ được phát hiện tự động — bạn không cần chọn.

Tôi có thể phiên âm video không?

Không trực tiếp. Để chuyển âm thanh video thành văn bản, hãy trích xuất âm thanh trước (bất kỳ công cụ nào xuất MP3 hoặc WAV đều được) rồi kéo thả vào đây.

Có hoạt động ngoại tuyến không?

Sau khi mô hình đã được tải xuống một lần, có — chuyển âm thanh thành văn bản miễn phí hoạt động ngoại tuyến. Trang cần được tải trước, nhưng các lần chuyển đổi tiếp theo hoạt động mà không cần internet.

Làm thế nào để chuyển MP3 thành văn bản miễn phí?

Kéo MP3 vào EarScribe để chuyển MP3 thành văn bản miễn phí. Tệp được giải mã trong trình duyệt, Whisper phiên âm cục bộ, và bạn có thể sao chép kết quả hoặc xuất ra SRT, VTT, TXT hoặc JSON. Không có bước tải lên và không cần tài khoản.

Có giải pháp thay thế miễn phí cho Otter.ai hay Rev không?

EarScribe là giải pháp thay thế miễn phí cho các dịch vụ phiên âm đám mây như Otter.ai, Rev và HappyScribe. Sự đánh đổi: bạn xử lý trên máy của mình để có giọng nói thành văn bản miễn phí, nhưng âm thanh không bao giờ rời khỏi máy và không có phí theo phút hay đăng ký.

Tôi có thể tạo phụ đề SRT hay VTT từ âm thanh không?

Có. Sau khi chuyển âm thanh thành văn bản, nhấp Xuất → .srt hoặc .vtt. Thời gian cue đến từ dấu thời gian do Whisper tạo ra, nên phụ đề khớp với kết quả mà không cần cắt thủ công.

Đây có chạy OpenAI Whisper trên trình duyệt không?

Có — EarScribe chạy chuyển âm thanh thành văn bản miễn phí qua Whisper (Tiny, Base, Small, và Large v3 Turbo) trực tiếp trên trình duyệt thông qua Transformers.js trên WebGPU, chuyển sang WebAssembly khi không có sẵn.