কম্পিউটার

পাইথনে Pydub এবং Google Speech Recognition API ব্যবহার করে অডিও প্রক্রিয়াকরণ


এই টিউটোরিয়ালে, আমরা অডিও ফাইল নিয়ে কাজ করতে যাচ্ছি। এতে থাকা বিষয়বস্তু চিনতে আমরা অডিওটিকে খণ্ডে ভাগ করব। আমরা অডিও ফাইলের বিষয়বস্তু টেক্সট ফাইলেও সংরক্ষণ করব। নীচের কমান্ডগুলি ব্যবহার করে নিম্নলিখিত মডিউলগুলি ইনস্টল করুন৷

pip install pydub

আপনি যদি উপরের কমান্ডটি চালান, আপনি নিম্নলিখিত সফল বার্তাটি পাবেন

 সংগ্রহ করা হচ্ছে pydubDownloading https://files.pythonhosted.org/packages/79/db/eaf620b73a1eec3c8c6f8f5b0b236a50f9da88ad57802154b7ba7664d0b8.pydub154b7ba7664d0b8/pydub1yone-pydub3-package/pydub1dfully-installed. প্রাক> 
পিপ ইনস্টল অডিওরিড

আপনি যদি উপরের কমান্ডটি চালান, আপনি নিম্নলিখিত সফল বার্তা পাবেন৷

অডিও-রিডডাউনলোডিং সংগ্রহ করা হচ্ছে https://files.pythonhosted.org/packages/2e/0b/940ea7861e0e9049f09dcfd72a90c9ae55f697c17c299a323f0148f913d2/13d2/13d2/17/2/17/2/17/2/17/ audioread (setup.py):STATULEADIONDOREAD চাকা দিয়ে সমাপ্তি:FIRENAME =AUDIOREAD-2.1.8-CP37-NO-THE.WHL SIZE =23098 SHA256 =92B6F46D4B47444BA7433187184744BA74E23187123E67F663650F24390DC9DC9DSTored ডিরেক্টরি:C:\ ব্যবহারকারীদের \ HAFEEZUZUZAREEM \ APPDATA \Local\pip\Cache\wheels\b9\64\09\0b6417df9d8ba8bc61a7d2553c5cebd714ec169644c88fc012সফলভাবে তৈরি করা অডিওরিড সংগৃহীত প্যাকেজ ইনস্টল করা হচ্ছে:audioread সফলভাবে ইনস্টল করা হয়েছে অডিওপ্রে-2> 
পিপ ইনস্টল স্পিচ রিকগনিশন

আপনি যদি উপরের কমান্ডটি চালান, আপনি নিম্নলিখিত সফল বার্তা পাবেন৷

 SpeechRecognitionDownloading https://files.pythonhosted.org/packages/26/e1/7f5678cd94ec1234269d23756dbdaa4c8cfaed973412f88ae8adf7893a50/SpeechRecognition-3.8.1-py2.py3-none-any.whl(32.8MB)Installing সংগৃহীত প্যাকেজ সংগ্রহ:SpeechRecognitionSuccessfully SpeechRecognition- ইনস্টল 3.8.1

আমাদের প্রক্রিয়ায় দুটি ধাপ রয়েছে।

  • অডিওকে টুকরো টুকরো করা হচ্ছে।

  • আমাদের SpeechRecognition ব্যবহার করে বিষয়বস্তু বের করতে হবে .

আপনার লাইব্রেরি থেকে একটি অডিও ফাইল নিন। কোড শুরু করা যাক।

উদাহরণ

# মডিউল আমদানি করা pydubimport speech_recognition# অডিও ফাইল অডিও পাওয়া =pydub.AudioSegment.from_wav('audio.wav')# অডিওর দৈর্ঘ্য মিলিসেকেন্ডে অডিও_লেংথ =লেন(অডিও)প্রিন্ট(f'Audio Length'_auth:{audio) )# খণ্ড counterchunk_counter =1audio_text =open('audio_text.txt', 'w+')# সেটিং যেখানে অডিওপয়েন্ট স্লাইস করতে হবে =60000# ওভারল্যাপ - slicingrem এর পরে অবশিষ্ট অডিও =8000# খণ্ডগুলি ট্র্যাক করার জন্য ভেরিয়েবল শুরু করা এবং শেষ =0 আর্টফ্ল্যাগ =0 0# সীমার মধ্যে remfor i বৃদ্ধির সাথে অডিওর মাধ্যমে পুনরাবৃত্তি (0, 2 * অডিও_দৈর্ঘ্য, পয়েন্ট):# প্রথম পুনরাবৃত্তির শেষে =rem যদি i ==0:শুরু =0 শেষ =পয়েন্ট else:# অন্যান্য পুনরাবৃত্তি শুরু =শেষ - rem end =start + point # যদি শেষ অডিও_দৈর্ঘ্যের চেয়ে বড় হয় যদি শেষ>=audio_length:end =audio_length # স্টপ ফ্ল্যাগ নির্দেশ করতে =1 # অডিও খণ্ড থেকে একটি খণ্ড পাওয়া =অডিও[start:end] # খণ্ডের নাম chunk_name =f'chunk_{chunk_counter}' # সংরক্ষণ করা গ স্থানীয় স্টোরেজ chunk.export(chunk_name, format ='wav') # খণ্ড মুদ্রণ মুদ্রণ করুন অডিও থেকে # সনাক্তকারী সনাক্তকারীর শুরু করা =speech_recognition.Recognizer() # স্পিচ_রিকোগনিশনের সাথে একটি শোনা অডিও তৈরি করা। অডিওফাইল(খণ্ড_নাম) খণ্ড_অডিও হিসাবে:chunk_listened =সনাক্তকারী.listen(chunk_audio) # অডিও থেকে সামগ্রী সনাক্ত করার চেষ্টা করুন:# থেকে সামগ্রী পাওয়া খণ্ড বিষয়বস্তু =স্বীকৃতি. স্বীকৃতি_গুগল(খণ্ড_লিসেনড) # ফাইলে লেখা audio_text.write(content + '\n') # যদি স্পীচ_রিকোগনিশন ছাড়া স্বীকৃত না হয়। অজানামূল্য ত্রুটি:মুদ্রণ('অডিও স্বীকৃত নয়') # স্পিচ_রিকোগনিশন ছাড়া ইন্টারনেট ত্রুটি। অনুরোধ ত্রুটি ত্রুটি হিসাবে:মুদ্রণ ('ইন্টারনেটের সাথে সংযোগ করতে পারে না') # পতাকা পরীক্ষা করা হচ্ছে যদি পতাকা ==1:audio_text.close() বিরতি

আউটপুট

আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷

অডিও দৈর্ঘ্য:480052CHUNK_1 শুরু:0 END:60000CHUNK_2 শুরু:52000 শেষ:164000CHUNK_4 শুরু:156000 শেষ:216000CHUNK_5 শুরু:208000 শেষ:268000CHUNK_6 শুরু:260000 শেষ:320000CHUNK_7 শুরু:312000 শেষ:372000Chunk_8 শুরু :364000 শেষ:424000chunk_9 শুরু:416000 শেষ:476000chunk_10 শুরু:468000 শেষ:480052

ফাইলের বিষয়বস্তু পরীক্ষা করা হচ্ছে।

# ফাইলটি ওপেন('audio_text.txt', 'r') দিয়ে রিড মোডে ফাইল খুলছে:print(file.read())

আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন।

ইংরেজি এবং আমি এখানে সান ফ্রান্সিসকোতে আছি আমি গত সপ্তাহে সান ফ্রান্সিসকোতে ফিরে এসেছি আমরা একটি শিক্ষাদানের দেশে টেক্সাসে ছিলাম এবং পাঠদান সম্মেলনের পাঠক একটি প্লেন ছিল পাঠদানকে পুনরায় উন্নত করুন ফলস্বরূপ আপনি হাউসের ব্যাকআপ ফাইলটি খারাপ সহ এতে কিছু ইংরেজি ছিল শীঘ্রই আসছে একদিন শুধু মাত্র 12টা 1টা। এখন তার ইংরেজি সম্পর্কে সবকিছু বা আপনার শহরে আমার ইমেল তালিকার স্পোর্টস চালু করুন আপনার ইমেল ইমেল চেক করুন হারজিৎ বান্ধবী পরের মঙ্গলবার বছরটি চেক করুন অফিস উপভোগ করুন ইংরেজি শুনতে থাকুন হাসতে থাকুন আপনার ইংরেজি শেখার আনন্দে থাকুন

উপসংহার

টিউটোরিয়াল সম্পর্কে আপনার কোন সন্দেহ থাকলে মন্তব্য বিভাগে উল্লেখ করুন।


  1. পাইথন এবং স্ক্র্যাপি ব্যবহার করে ওয়েব স্ক্র্যাপিং?

  2. পাইথনে gmplot প্যাকেজ ব্যবহার করে গুগল ম্যাপ প্লট করছেন?

  3. পাইথনে নিউজ API ব্যবহার করে শীর্ষ সংবাদ আনা হচ্ছে

  4. একটি ম্যাকে পাইথন 3 আপগ্রেড করা এবং ব্যবহার করা