เกี่ยวกับ EarScribe

EarScribe เป็นเว็บแอปแบบสแตติกที่รันโมเดลจดจำเสียงพูด Whisper ของ OpenAI โดยตรงในเบราว์เซอร์ของคุณโดยใช้ Transformers.js และ WebGPU / WebAssembly runtime

ไม่มีแบ็กเอนด์ใดที่แตะต้องเสียงของคุณ โฮสต์ Cloudflare Pages ให้บริการเพียง HTML, JS และ CSS แบบสแตติก น้ำหนักโมเดล Whisper ถูกดึงจาก CDN ของ Hugging Face ในการใช้งานครั้งแรกและถูกแคชโดยเบราว์เซอร์ของคุณ

สร้างบน Transformers.js, ONNX Runtime Web และโมเดล Whisper โอเพนซอร์สจาก OpenAI

แปลงเสียงเป็นข้อความฟรีไม่จำกัด — คำถามที่พบบ่อย

EarScribe ฟรี 100% จริงๆ โดยไม่มีข้อจำกัดใช่หรือไม่?

ใช่ — ฟรี 100% ไม่จำกัด ไม่ต้องสมัครและไม่ต้องเข้าสู่ระบบ ไม่มีแพ็กเกจชำระเงิน ไม่ต้องใช้บัตรเครดิต ไม่มีค่าธรรมเนียมรายนาที และไม่มีโควต้ารายวันหรือรายเดือน โมเดล Whisper ทำงานบนฮาร์ดแวร์ของคุณเอง จึงไม่มีค่าใช้จ่ายการประมวลผลคลาวด์ แปลงเสียงเป็นข้อความฟรีโดยไม่มีเงื่อนไข

เสียงของฉันเป็นส่วนตัวและปลอดภัยหรือไม่?

เป็นส่วนตัวอย่างสมบูรณ์ EarScribe เป็นเครื่องมือแปลงเสียงเป็นข้อความที่ทำงานในเครื่องก่อน: ไฟล์เสียงของคุณไม่เคยออกจากอุปกรณ์และไม่เคยถูกอัปโหลดไปยังเซิร์ฟเวอร์ใดๆ ไม่มีบัญชีหมายความว่าไม่มีการเก็บรวบรวมข้อมูลเกี่ยวกับคุณ คุณยังสามารถใช้แบบออฟไลน์ได้หลังจากดาวน์โหลดโมเดลแล้ว

เสียงของฉันถูกอัปโหลดไปที่ไหนหรือไม่?

ไม่ การแปลงเสียงเป็นข้อความฟรีเกิดขึ้นในเครื่องทั้งหมด — เสียงถูกถอดรหัสบนอุปกรณ์ของคุณและส่งไปยังโมเดล Whisper ที่รันใน Web Worker ไม่มีข้อมูลถูกส่งไปยังเซิร์ฟเวอร์

ทำไมครั้งแรกถึงช้า?

ครั้งแรกที่คุณเลือกโมเดลเพื่อแปลงเสียงเป็นข้อความ เบราว์เซอร์ของคุณจะดาวน์โหลดมัน (80 MB ถึง 800 MB ขึ้นอยู่กับขนาด) หลังจากนั้นโมเดลแปลงเสียงเป็นข้อความฟรีจะถูกแคชและนำมาใช้ใหม่ — ไม่ต้องดาวน์โหลดซ้ำ

รองรับภาษาใดบ้าง?

การแปลงเสียงเป็นข้อความฟรีรองรับ 99 ภาษาผ่าน Whisper ภาษาจะถูกตรวจจับโดยอัตโนมัติ — คุณไม่จำเป็นต้องเลือก

ถอดเสียงวิดีโอได้หรือไม่?

ไม่ได้โดยตรง สำหรับการแปลงเสียงวิดีโอเป็นข้อความ ให้แยกไฟล์เสียงก่อน (เครื่องมือใดก็ได้ที่ออก MP3 หรือ WAV จะใช้ได้) แล้วลากมาวางที่นี่

ใช้งานแบบออฟไลน์ได้หรือไม่?

หลังจากดาวน์โหลดโมเดลครั้งหนึ่งแล้ว ใช่ — การแปลงเสียงเป็นข้อความฟรีทำงานแบบออฟไลน์ได้ หน้าเว็บต้องโหลดก่อน แต่การแปลงเสียงครั้งต่อๆ ไปทำงานได้โดยไม่ต้องใช้อินเทอร์เน็ต

จะแปลง MP3 เป็นข้อความฟรีได้อย่างไร?

ลาก MP3 มาวางที่ EarScribe เพื่อแปลง MP3 เป็นข้อความฟรี ไฟล์จะถูกถอดรหัสในเบราว์เซอร์ของคุณ Whisper ถอดเสียงในเครื่อง และคุณสามารถคัดลอกผลลัพธ์หรือส่งออกเป็น SRT, VTT, TXT หรือ JSON ไม่มีขั้นตอนการอัปโหลดและไม่ต้องมีบัญชี

มีทางเลือกฟรีแทน Otter.ai หรือ Rev หรือไม่?

EarScribe เป็นทางเลือกฟรีสำหรับบริการถอดเสียงบนคลาวด์อย่าง Otter.ai, Rev และ HappyScribe ข้อแลกเปลี่ยนคือ: คุณประมวลผลบนเครื่องของตัวเองเพื่อแปลงเสียงพูดเป็นข้อความฟรี แต่เสียงไม่เคยออกจากเครื่องและไม่มีค่าธรรมเนียมรายนาทีหรือค่าสมัครสมาชิก

สามารถสร้างซับไตเติล SRT หรือ VTT จากเสียงได้หรือไม่?

ได้ หลังจากแปลงเสียงเป็นข้อความแล้ว คลิกส่งออก → .srt หรือ .vtt เวลาของ cue มาจากเวลาประทับที่ Whisper สร้างขึ้น ดังนั้นซับไตเติลจึงสอดคล้องกับผลลัพธ์โดยไม่ต้องตัดด้วยตนเอง

นี่คือการรัน OpenAI Whisper ในเบราว์เซอร์หรือไม่?

ใช่ — EarScribe รันการแปลงเสียงเป็นข้อความฟรีผ่าน Whisper (Tiny, Base, Small และ Large v3 Turbo) โดยตรงในเบราว์เซอร์ผ่าน Transformers.js บน WebGPU โดยสำรองไปใช้ WebAssembly เมื่อไม่มี WebGPU