EarScribe সম্পর্কে
EarScribe একটি স্ট্যাটিক ওয়েব অ্যাপ যা Transformers.js এবং WebGPU / WebAssembly রানটাইম ব্যবহার করে সরাসরি আপনার ব্রাউজারে OpenAI-এর Whisper স্পিচ-রিকগনিশন মডেল চালায়।
কোনো ব্যাকএন্ড নেই যা আপনার অডিও স্পর্শ করে। Cloudflare Pages হোস্ট শুধু স্ট্যাটিক HTML, JS এবং CSS পরিবেশন করে। Whisper মডেলের ওজন প্রথম ব্যবহারে Hugging Face CDN থেকে আনা হয় এবং আপনার ব্রাউজার ক্যাশ করে রাখে।
Transformers.js, ONNX Runtime Web এবং OpenAI-এর ওপেন-সোর্স Whisper মডেলের উপর নির্মিত।
বিনামূল্যে সীমাহীন অডিও থেকে টেক্সট — প্রশ্নোত্তর
EarScribe কি সত্যিই ১০০% বিনামূল্যে এবং সীমাহীন?
হ্যাঁ — ১০০% বিনামূল্যে, সীমাহীন, কোনো সাইন-আপ ও লগইন ছাড়া। কোনো পেইড প্ল্যান নেই, ক্রেডিট কার্ড নেই, প্রতি মিনিটের চার্জ নেই, এবং দৈনিক বা মাসিক কোনো সীমা নেই। Whisper স্পিচ থেকে টেক্সট মডেলটি আপনার নিজের হার্ডওয়্যারে চলে, তাই কোনো ক্লাউড কম্পিউট খরচ নেই। কোনো শর্ত ছাড়াই বিনামূল্যে অডিও থেকে টেক্সট।
আমার অডিও কি প্রাইভেট ও নিরাপদ?
সম্পূর্ণ প্রাইভেট। EarScribe একটি লোকাল-ফার্স্ট অডিও থেকে টেক্সট কনভার্টার: আপনার অডিও ফাইল কখনো আপনার ডিভাইস ছাড়ে না এবং কোনো সার্ভারে আপলোড হয় না। কোনো অ্যাকাউন্ট নেই মানে আপনার সম্পর্কে কোনো ডেটা সংগ্রহ হয় না। মডেল ডাউনলোড হলে অফলাইনেও ব্যবহার করতে পারবেন।
আমার অডিও কি কোথাও আপলোড হয়?
না। বিনামূল্যে অডিও থেকে টেক্সট সম্পূর্ণ স্থানীয়ভাবে হয় — অডিও আপনার ডিভাইসে ডিকোড হয় এবং একটি Web Worker-এ চলা Whisper মডেলে পাঠানো হয়। কিছুই সার্ভারে পাঠানো হয় না।
প্রথমবার ধীর কেন?
প্রথমবার যখন আপনি অডিও থেকে টেক্সটের জন্য একটি মডেল বেছে নেন, আপনার ব্রাউজার সেটি ডাউনলোড করে (সাইজের উপর নির্ভর করে 80 MB থেকে 800 MB)। এরপর বিনামূল্যে অডিও থেকে টেক্সট মডেলটি ক্যাশ হয় এবং পুনরায় ব্যবহার হয় — আর ডাউনলোড করতে হয় না।
কোন ভাষাগুলি সমর্থিত?
বিনামূল্যে অডিও থেকে টেক্সট Whisper-এর মাধ্যমে ৯৯টি ভাষা সমর্থন করে। ভাষা স্বয়ংক্রিয়ভাবে শনাক্ত হয় — আপনাকে বেছে নিতে হবে না।
আমি কি ভিডিও ট্রান্সক্রাইব করতে পারি?
সরাসরি নয়। ভিডিও অডিও থেকে টেক্সটের জন্য প্রথমে অডিও বের করুন (MP3 বা WAV আউটপুট দিতে পারে এমন যেকোনো টুল কাজ করবে) এবং এখানে ফেলুন।
এটি কি অফলাইনে কাজ করে?
মডেল একবার ডাউনলোড হলে, হ্যাঁ — বিনামূল্যে অডিও থেকে টেক্সট অফলাইনে কাজ করে। পেজটি প্রথমে লোড হতে হবে, কিন্তু পরবর্তী অডিও থেকে টেক্সটের কাজ ইন্টারনেট ছাড়াই চলে।
MP3 কীভাবে বিনামূল্যে টেক্সটে রূপান্তর করব?
বিনামূল্যে MP3 থেকে টেক্সটের জন্য EarScribe-এ MP3 ফেলুন। ফাইলটি আপনার ব্রাউজারে ডিকোড হয়, Whisper স্থানীয়ভাবে ট্রান্সক্রাইব করে, এবং আপনি MP3 থেকে টেক্সট আউটপুট কপি করতে বা SRT, VTT, TXT বা JSON হিসেবে এক্সপোর্ট করতে পারবেন। কোনো আপলোড ধাপ নেই এবং কোনো অ্যাকাউন্ট লাগে না।
Otter.ai বা Rev-এর বিনামূল্যে বিকল্প আছে কি?
EarScribe হলো Otter.ai, Rev ও HappyScribe-এর মতো ক্লাউড ট্রান্সক্রিপশন সেবার বিনামূল্যে বিকল্প। পার্থক্য হলো: আপনি নিজের মেশিনে বিনামূল্যে স্পিচ থেকে টেক্সটের কম্পিউটিং করেন, কিন্তু অডিও কখনো সেখান থেকে বের হয় না এবং কোনো প্রতি মিনিটের চার্জ বা সাবস্ক্রিপশন নেই।
অডিও থেকে SRT বা VTT সাবটাইটেল তৈরি করা যাবে কি?
হ্যাঁ। অডিও থেকে টেক্সটের পর Export → .srt বা .vtt ক্লিক করুন। Cue-এর সময় Whisper-এর টাইমস্ট্যাম্প থেকে আসে, তাই সাবটাইটেলগুলি ম্যানুয়াল বিভাজন ছাড়াই অডিও থেকে টেক্সট আউটপুটের সাথে মিলে থাকে।
এটি কি ব্রাউজারে OpenAI Whisper চালায়?
হ্যাঁ — EarScribe Whisper (Tiny, Base, Small এবং Large v3 Turbo)-এর মাধ্যমে WebGPU-তে Transformers.js ব্যবহার করে সরাসরি ব্রাউজারে বিনামূল্যে অডিও থেকে টেক্সট চালায়, এবং WebGPU না থাকলে WebAssembly-তে ফলব্যাক করে।