কম্পিউটার

স্যাম্পলিং-ভিত্তিক পদ্ধতিগুলি কী?


নমুনা শ্রেণী ভারসাম্যহীনতা সমস্যা পরিচালনার জন্য একটি ব্যাপকভাবে ব্যবহৃত পদ্ধতি। স্যাম্পলিং এর ধারণা হল উদাহরণের বন্টন পরিবর্তন করা যাতে ট্রেনিং সেটে বিরল শ্রেণীটি ভালভাবে সংজ্ঞায়িত করা যায়। নমুনা নেওয়ার জন্য বিভিন্ন কৌশল রয়েছে যেমন আন্ডারস্যাম্পলিং, ওভারস্যাম্পলিং এবং উভয় পদ্ধতির একটি হাইব্রিড। উদাহরণস্বরূপ, একটি ডেটা সেট বিবেচনা করুন যাতে 100টি ইতিবাচক উদাহরণ এবং 1000টি নেতিবাচক উদাহরণ রয়েছে৷

আন্ডারস্যাম্পলিং পদ্ধতিতে, 100টি নেতিবাচক উদাহরণের একটি এলোমেলো নমুনা নির্বাচন করা হয়েছে যাতে সমস্ত ইতিবাচক উদাহরণের সাথে প্রশিক্ষণের ব্যবস্থা করা যায়। এই পদ্ধতিতে একটি সমস্যা হল যে কিছু সহায়ক নেতিবাচক উদাহরণ প্রশিক্ষণের জন্য নির্বাচন করা যায় না, তাই, সর্বোত্তম মডেলের চেয়ে কম ফলাফল হয়৷

এই সমস্যাটি কাটিয়ে ওঠার পদ্ধতিটি হল আন্ডারস্যাম্পলিং একাধিকবার প্রয়োগ করা এবং একাধিক ক্লাসিফায়ারকে ensemble Iearning পদ্ধতিতে প্ররোচিত করা। ফোকাসড আন্ডারস্যাম্পলিং পদ্ধতিগুলি ব্যবহার করা যেতে পারে, যেখানে নমুনা প্রক্রিয়া নেতিবাচক উদাহরণগুলির বিষয়ে একটি জ্ঞাত পছন্দ তৈরি করে যেগুলি সরানো উচিত, যেমন, সিদ্ধান্তের সীমানা থেকে অনেক দূরে অবস্থিত৷

ওভারস্যাম্পলিং ইতিবাচক উদাহরণগুলিকে প্রতিফলিত করে যতক্ষণ না প্রশিক্ষণ সেটে একই সংখ্যক ইতিবাচক এবং নেতিবাচক উদাহরণ থাকে। ডিসিশন ট্রি সহ একটি ক্লাসিফায়ার ব্যবহার করে সিদ্ধান্তের সীমানার বিকাশের উপর ওভারস্যাম্পিংয়ের প্রভাব। ইতিবাচক উদাহরণটি ভুল শ্রেণিবদ্ধ করা হয়েছে কারণ ইতিবাচক এবং নেতিবাচক দৃষ্টান্তগুলিকে স্বাধীন করার জন্য একটি নতুন সিদ্ধান্তের সীমানা গঠনের বৈধতা দেওয়ার জন্য পর্যাপ্ত উদাহরণ নেই৷

কিন্তু কোলাহলপূর্ণ তথ্যের জন্য, ওভারস্যাম্পলিং মডেল ওভারফিটিং তৈরি করতে পারে কারণ বেশ কয়েকটি শব্দের উদাহরণ একাধিকবার প্রতিলিপি করা যেতে পারে। ওভারস্যাম্পলিং প্রশিক্ষণ সেটে কিছু নতুন ডেটা সন্নিবেশ করে না। ইতিবাচক উদাহরণগুলির প্রতিলিপি মডেলের নির্দিষ্ট অংশগুলি ছাঁটাই থেকে শেখার অ্যালগরিদমকে এড়িয়ে যায় যা এমন অঞ্চলগুলিকে সংজ্ঞায়িত করে যাতে কিছু প্রশিক্ষণের উদাহরণ অন্তর্ভুক্ত থাকে (যেমন, ছোট বিচ্ছিন্নতা)। আরও ইতিবাচক উদাহরণগুলি মডেল তৈরির জন্য গণনার সময় বৃদ্ধিকেও প্রভাবিত করে৷

হাইব্রিড পদ্ধতিতে অভিন্ন শ্রেণী বন্টন বাস্তবায়নের জন্য সংখ্যাগরিষ্ঠ শ্রেণীর আন্ডারস্যাম্পলিং এবং বিরল শ্রেণীর ওভারস্যাম্পলিং প্রয়োজন। আন্ডারস্যাম্পলিং এলোমেলো বা ফোকাসড সাবস্যাম্পলিং ব্যবহার করে প্রয়োগ করা যেতে পারে। বর্তমান ইতিবাচক উদাহরণের প্রতিলিপি বা বর্তমান ইতিবাচক উদাহরণের আশেপাশে নতুন ইতিবাচক উদাহরণ তৈরি করে ওভারস্যাম্পলিং করা যেতে পারে।


  1. C# এ অ্যারের ভালো উদাহরণ কি কি?

  2. C# এ প্রতিফলন কি?

  3. C# এ ইনডেক্সার কি?

  4. C# এ নামস্থান কি?