টেক্সট-টু-স্পিচ কনভার্সন আপনার কাছে তেমন গুরুত্বপূর্ণ নাও মনে হতে পারে, কিন্তু তাই। দৃষ্টিপ্রতিবন্ধীদের কম্পিউটার উপভোগ করার অনুমতি দেওয়া ছাড়াও, এর অন্যান্য ব্যবহারও রয়েছে। কল্পনা করুন যে আপনি একটি গাড়িতে আছেন, আশা করি ড্রাইভ করছেন না এবং একটি পড়তে পছন্দ করুন৷ আপনি এই চেষ্টা করার সময় শুধুমাত্র আপনি ধরনের মাথা ঘোরা পেতে. অথবা সম্ভবত আপনি আপনার টিউটোরিয়ালগুলিতে একটি অডিও মাত্রা যোগ করতে চান যাতে পাঠ্যের দীর্ঘ লাইন প্রতিস্থাপন করে বক্তৃতা থাকে।
উৎসব তাই করে। এটি একটি স্পিচ সিন্থেসিস সিস্টেম, যা আপনাকে পাঠ্যকে বক্তৃতায় রূপান্তর করতে দেয়। উৎসব বেশ সুবিধাজনক। এটি স্ক্রিপ্টিংয়ের অনুমতি দেয় এবং বিভিন্ন প্রোগ্রামিং ভাষার জন্য এপিআই রয়েছে। বর্তমানে, ফেস্টিভ্যাল আমেরিকান এবং ব্রিটিশ ইংরেজিতে বেশ কয়েকটি পুরুষ এবং মহিলা কণ্ঠ এবং স্প্যানিশের জন্য প্রাথমিক সমর্থন খেলা করে।
একবার দেখা যাক.
কর্মে উৎসব
উত্সব বেশিরভাগ প্রধান বিতরণের ভান্ডারে উপলব্ধ, তাই ইনস্টলেশনে কোনও সমস্যা হওয়া উচিত নয়। উত্সব একটি কমান্ড লাইন টুল, কোন গ্রাফিকাল ইন্টারফেস ছাড়া. এটি ব্যবহার করে রকেট বিজ্ঞান লাগে না, তবে প্রাথমিক নির্দেশাবলীর জন্য আপনার অনলাইন ম্যানুয়ালটি দেখুন।
সাধারণভাবে, ফেস্টিভ্যাল ইন্টারেক্টিভ মোডে চলে। আপনি প্রোগ্রাম চালু করুন এবং তারপর কি বলতে হবে তা বলুন। কিন্তু আপনি বই বা কাগজপত্রের মতো ফাইলের বিরুদ্ধেও প্রোগ্রাম চালাতে পারেন, বা অন্যান্য অ্যাপ্লিকেশন থেকে ফেস্টিভালে পাইপ টেক্সট।
ইন্টারেক্টিভ মোড
কমান্ড লাইনে উত্সব টাইপ করে উত্সব শুরু করুন।
তারপর এটিকে কিছু বলতে, নিম্নলিখিত কমান্ডটি চালান:
("আপনার পাঠ্য এখানে" বলুন)
এখানে একটি স্ক্রিনশট উদাহরণ:
ফাইল মোড
কমান্ড লাইনে টেক্সটের লম্বা লাইন টাইপ করার পরিবর্তে, আপনি একটি টেক্সট লাইনের বিপরীতে ফেস্টিভাল চালাতে পারেন। অডিও বই, সেমিনার উপাদান এবং এই ধরনের জন্য সত্যিই দরকারী.
এখানে একটি নমুনা ফাইল আছে:
এবং তারপর, এই ফাইলের বিরুদ্ধে ফেস্টিভাল চালান:
উৎসব --tts
টেক্সট-টু-স্পীচ রেকর্ড করুন
আপনি অডিও ফাইল তৈরি করতে আপনার সাউন্ড রেকর্ডিং সফ্টওয়্যারে ফেস্টিভাল সাউন্ড ফিড করতে পারেন, যা আপনি পরে আপনার উপযুক্ত মনে হলে প্রক্রিয়া করতে পারেন। উদাহরণস্বরূপ, আপনি এটি করতে জিনোম সাউন্ড রেকর্ডার ব্যবহার করতে পারেন।
এখানে এই ফ্যাশনে রেকর্ড করা 12-সেকেন্ডের নমুনা।
festival-demo.ogg, 12 sec, 253KB
এখন, সেরা অংশ, আপনি সত্যিই উপরের সব এড়িয়ে যেতে পারেন. ফেস্টিভ্যাল একটি অন্তর্নির্মিত স্ক্রিপ্ট সহ আসে যা ইনপুট পাঠ্য থেকে স্বয়ংক্রিয়ভাবে .wav ফাইল তৈরি করবে। স্ক্রিপ্টটিকে বলা হয় text2wave।
text2wave
ভয়েস
উপলব্ধ বেশ কিছু ভয়েস আছে. সেগুলি কেমন শোনাচ্ছে তা দেখতে আপনি অনলাইন ডেমোটিও চেষ্টা করতে পারেন। সাধারণভাবে, আমি ব্রিটিশ কণ্ঠগুলিকে আরও বাস্তবসম্মত, আরও সুগঠিত এবং বোঝা সহজ বলে মনে করেছি। কিন্তু এটা সম্পূর্ণ আপনার পছন্দ.
উপসংহার
উত্সব একটি খুব সহজ সফ্টওয়্যার, সহজ এবং দরকারী. এমনকি যদি আপনি প্রোগ্রামে তাৎক্ষণিকভাবে ব্যবহার দেখতে না পান, আপনি এটিকে আপনার নিজস্ব মাল্টিমিডিয়া সরঞ্জামের অস্ত্রাগারে প্রবর্তন করার কথা বিবেচনা করতে পারেন, অডিও-ভিডিও বক্তৃতা, টিউটোরিয়াল বা শুধু মজার মতো ব্যবহারিক উদ্দেশ্যেই হোক না কেন।
আমি আশা করি আপনি এই গাইড পছন্দ করেছেন. এখন যেহেতু আমরা টেক্সট-টু-স্পিচ সফ্টওয়্যার সম্পর্কে আরও কিছু জানি, আমরা শীঘ্রই লিনাক্সের স্ক্রিন রিডার সফ্টওয়্যার Orca পরীক্ষা করব এবং অন্যান্য অ্যাক্সেসিবিলিটি বৈশিষ্ট্যগুলির দিকে নজর দেব। আপাতত, আপনি দৃষ্টি প্রতিবন্ধী ব্যবহারকারীদের জন্য বিশেষভাবে ডিজাইন করা Knoppix Adriane-এ একবার নজর দিতে পারেন।
চিয়ার্স।