কম্পিউটার

বায়াস-ভ্যারিয়েন্স পচন কি?


একাধিক অনুমানে যোগদানের প্রভাবটি বায়াস-ভ্যারিয়েন্স পচন নামক একটি তাত্ত্বিক যন্ত্রের মাধ্যমে পরীক্ষা করা যেতে পারে। ধরুন এটিতে অনুরূপ আকারের অসীম সংখ্যক পৃথক প্রশিক্ষণ সেট থাকতে পারে এবং অসীম সংখ্যক শ্রেণিবিন্যাস তৈরি করতে সেগুলি ব্যবহার করতে পারে৷

একটি পরীক্ষা দৃষ্টান্ত সমস্ত শ্রেণীবদ্ধকারী দ্বারা চিকিত্সা করা হয়, এবং একটি পৃথক উত্তর বাল্ক ভোট দ্বারা নির্ধারিত হয়। এই পরিস্থিতিতে, ত্রুটি প্রদর্শিত হবে কারণ কোন শেখার নকশা নিখুঁত নয়। মেশিন লার্নিং পদ্ধতিগুলি হাতের সমস্যাটিকে কতটা ভালভাবে সংযুক্ত করে তার উপর ভিত্তি করে ত্রুটির হার হবে, এবং রেকর্ডে শব্দের প্রভাবও রয়েছে, যা সম্ভবত শেখা যায় না৷

ধরুন প্রত্যাশিত ত্রুটির হারটি পৃথকভাবে নির্বাচিত পরীক্ষার উদাহরণগুলির অসীম সংখ্যার উপর লিঙ্কযুক্ত শ্রেণীবদ্ধকারীর ত্রুটির গড় করে গণনা করা হয়েছিল। একটি নির্দিষ্ট শেখার অ্যালগরিদমের ত্রুটির হার শেখার সমস্যার জন্য এটির পক্ষপাত হিসাবে পরিচিত এবং শেখার পদ্ধতিটি কতটা ভালভাবে সমস্যাটিকে সংযুক্ত করে তা গণনা করে৷

এটি একটি শেখার অ্যালগরিদমের "স্থির" ত্রুটি গণনা করে যা অসীম সংখ্যক প্রশিক্ষণ গোষ্ঠীকে বিবেচনায় নিয়েও মুছে ফেলা যায় না। এটি ব্যবহারিক পরিস্থিতিতে সঠিকভাবে গণনা করা যায় না; এটা শুধুমাত্র আনুমানিক হতে পারে।

একটি শেখা মডেলে ত্রুটির দ্বিতীয় উত্সটি ব্যবহৃত নির্দিষ্ট প্রশিক্ষণ সেট থেকে উদ্ভূত হয়, যা অগত্যা সসীম এবং তাই দৃষ্টান্তের প্রকৃত জনসংখ্যার সম্পূর্ণ প্রতিনিধি নয়৷

ত্রুটির এই উপাদানটির প্রত্যাশিত মান, প্রদত্ত আকারের সমস্ত সম্ভাব্য প্রশিক্ষণ গোষ্ঠী এবং সম্ভাব্য সমস্ত পরীক্ষার সেটের উপর, সেই সমস্যার জন্য শেখার পদ্ধতির বৈচিত্র হিসাবে পরিচিত। একটি শ্রেণিবিন্যাসকারীর সম্পূর্ণ প্রত্যাশিত ত্রুটিটি মোট পক্ষপাত এবং বৈচিত্র্যের সমন্বয়ে তৈরি হয়-এটি পক্ষপাত-ভেরিয়েন্সের পচন।

বর্গাকার ত্রুটির উপর নির্ভর করে গাণিতিক ভবিষ্যদ্বাণীর প্রেক্ষাপটে পক্ষপাত-ভেরায়েন্স পচন শেখা হয়েছিল, যেখানে এটি বাস্তবায়নের একটি ব্যাপকভাবে স্বীকৃত উপায় রয়েছে। যাইহোক, শ্রেণীবিভাগের জন্য পরিস্থিতি পরিষ্কার নয়, এবং বিভিন্ন প্রতিযোগিতামূলক পচনের পরামর্শ দেওয়া হয়েছে।

ব্যাগিং একটি প্রদত্ত প্রশিক্ষণ সেট ব্যবহার করে পূর্বে সংজ্ঞায়িত ফেজ অনুকরণ করে শেখার পদ্ধতির অস্থিরতাকে বাতিল করার চেষ্টা করে। প্রতিবার একটি নতুন, পৃথক প্রশিক্ষণ ডেটাসেটের নমুনা নেওয়ার পরিবর্তে, প্রাথমিক প্রশিক্ষণ ডেটা কিছু দৃষ্টান্ত মুছে এবং অন্যগুলি অনুলিপি করে পরিবর্তন করা হয়। দৃষ্টান্তগুলিকে এলোমেলোভাবে নমুনা করা হয়, পুনরুদ্ধার সহ, প্রাথমিক ডেটাসেট থেকে সমান আকারের একটি নতুন তৈরি করতে। এই নমুনা প্রক্রিয়া অনিবার্যভাবে কিছু দৃষ্টান্ত অনুলিপি করে এবং অন্যকে সরিয়ে দেয়।

রিস্যাম্পলিং দ্বারা তৈরি ডেটাসেটগুলি একে অপরের থেকে আলাদা কিন্তু স্বাধীন নয় কারণ সেগুলি একটি ডেটাসেটে প্রতিষ্ঠিত। যাইহোক, এটি দেখা যাচ্ছে যে ব্যাগিং একটি সম্মিলিত মডেল তৈরি করে যা প্রাথমিক প্রশিক্ষণ ডেটা থেকে পৃথক মডেল নির্মাণের তুলনায় উল্লেখযোগ্যভাবে ভাল প্রয়োগ করে এবং এটি কখনই খারাপ হয় না।


  1. THREAD_STUCK_IN_DEVICE_DRIVER ত্রুটি কি?

  2. HP পরিষেবা ত্রুটি 79 কি?

  3. রব্লক্স ত্রুটি 610 সম্পর্কে কী করবেন

  4. ম্যাকের ত্রুটি কোড 36 কি?