কম্পিউটার

এনসেম্বল ক্লাসিফায়ার তৈরির পদ্ধতিগুলি কী কী?


ধারণাটি হল প্রাথমিক ডেটা থেকে একাধিক শ্রেণিবিন্যাস তৈরি করা এবং তারপরে অজানা উদাহরণগুলি বর্ণনা করার সময় তাদের ভবিষ্যদ্বাণীগুলিকে একত্রিত করা। শ্রেণিবিন্যাসকারীদের সংমিশ্রণ বিভিন্ন পদ্ধতিতে তৈরি করা যেতে পারে যা নিম্নরূপ -

প্রশিক্ষণ সেট ম্যানিপুলেট করে − এই পদ্ধতিতে, কিছু স্যাম্পলিং ডিস্ট্রিবিউশন অনুযায়ী প্রাথমিক ডেটা পুনরায় নমুনা করে একাধিক প্রশিক্ষণ সেট তৈরি করা হয়। স্যাম্পলিং ডিস্ট্রিবিউশন সিদ্ধান্ত নেয় যে দৃষ্টান্তগুলিকে প্রশিক্ষণের জন্য বেছে নেওয়ার কতটা সম্ভাবনা, এবং এটি এক ট্রায়াল থেকে অন্য ট্রায়ালে পরিবর্তিত হতে পারে। একটি নির্দিষ্ট লার্নিং অ্যালগরিদম ব্যবহার করে প্রতিটি প্রশিক্ষণ সেট থেকে একটি শ্রেণিবদ্ধকারী তৈরি করা হয়। ব্যাগিং এবং বুস্টিং হল এনসেম্বল পদ্ধতির উদাহরণ যা তাদের প্রশিক্ষণ সেটগুলিকে কাজে লাগায়।

ইনপুট বৈশিষ্ট্য ম্যানিপুলেট করে − এই পদ্ধতিতে, প্রতিটি প্রশিক্ষণ সেট গঠনের জন্য ইনপুট বৈশিষ্ট্যগুলির একটি উপসেট নির্বাচন করা হয়। উপসেটটি এলোমেলোভাবে নির্বাচন করা যেতে পারে বা ডোমেন পেশাদারদের সুপারিশের উপর নির্ভর করে। বেশ কয়েকটি গবেষণায় একটি প্রদর্শন রয়েছে যে এই পদ্ধতিটি ডেটা সেটগুলির সাথে খুব ভালভাবে কাজ করে যা অত্যন্ত অপ্রয়োজনীয় বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে। র‍্যান্ডম ফরেস্ট হল একটি সমন্বিত কৌশল যা এর ইনপুট বৈশিষ্ট্যগুলিকে কাজে লাগায় এবং এর ভিত্তি শ্রেণীবদ্ধকারী হিসাবে সিদ্ধান্ত গাছের প্রয়োজন৷

শ্রেণির লেবেলগুলিকে ম্যানিপুলেট করে - এই পদ্ধতিটি ব্যবহার করা যেতে পারে যখন বেশ কয়েকটি শ্রেণী পর্যাপ্ত পরিমাণে বড় হয়। ক্লাস লেবেলগুলিকে এলোমেলোভাবে A0 এবং A1-এর মতো দুটি বিচ্ছিন্ন উপসেটে ভাগ করে প্রশিক্ষণের ডেটা একটি বাইনারি ক্লাস সমস্যায় পরিবর্তিত হয়।

যে প্রশিক্ষণের দৃষ্টান্তগুলির ক্লাস লেবেলগুলি সাবসেট A0-তে প্রযোজ্য তা শ্রেণী 0-তে সংজ্ঞায়িত করা হয়, যখন উপসেট A1-এ প্রযোজ্য সেগুলিকে শ্রেণী 1-তে সংজ্ঞায়িত করা হয়৷ পুনঃনির্দেশিত দৃষ্টান্তগুলি একটি বেস শ্রেণীবদ্ধকারীকে প্রশিক্ষণ দিতে ব্যবহৃত হয়৷ বারবার, ক্লাস-রিবেলিং এবং মডেল-বিল্ডিং ধাপে কয়েকবার, বেস ক্লাসিফায়ারগুলির একটি সংকলন অর্জিত হয়।

যখন একটি পরীক্ষার উদাহরণ উপস্থাপন করা হয়, তখন প্রতিটি বেস ক্লাসিফায়ার Ci তার ক্লাস লেবেলের পূর্বাভাস দিতে পারে। যদি পরীক্ষার দৃষ্টান্তগুলি ক্লাস 0 হিসাবে পূর্বাভাস দেওয়া হয়, তাই A0-তে প্রযোজ্য সমস্ত ক্লাস একটি ভোট পাবে৷

লার্নিং অ্যালগরিদম ম্যানিপুলেট করে − বেশ কিছু শেখার অ্যালগরিদম এমন একটি পদ্ধতিতে ম্যানিপুলেট করা যেতে পারে যে সমান প্রশিক্ষণ ডেটাতে একাধিকবার অ্যালগরিদম ব্যবহার করলে একাধিক মডেল হতে পারে। উদাহরণস্বরূপ, একটি কৃত্রিম নিউরাল নেটওয়ার্ক তার নেটওয়ার্ক টপোলজি বা নিউরনের মধ্যে সংযোগের মূল ওজন পরিবর্তন করে বেশ কয়েকটি মডেল তৈরি করতে পারে। একইভাবে, বৃক্ষ-বৃদ্ধি প্রক্রিয়ার মধ্যে এলোমেলোতা ইনজেকশনের মাধ্যমে সিদ্ধান্ত গাছের একটি সংকলন একত্রিত করা যেতে পারে।

প্রথম তিনটি পদ্ধতি হল জেনেরিক কৌশল যা কিছু শ্রেণীবিভাগের জন্য প্রাসঙ্গিক, যেখানে চতুর্থ পদ্ধতিটি ব্যবহৃত শ্রেণীবিভাগের ধরণের উপর ভিত্তি করে। বেস ক্লাসিফায়ার পদ্ধতিগুলি ক্রমানুসারে (একের পর এক) বা সমান্তরালভাবে (একবারে) তৈরি করা যেতে পারে।

প্রথম প্রক্রিয়াটি হল প্রাথমিক ডেটা D থেকে একটি প্রশিক্ষণ সেট তৈরি করা। এটি ব্যবহৃত এনসেম্বল পদ্ধতির ধরণের উপর ভিত্তি করে তৈরি করা হয়, প্রশিক্ষণ সেটগুলি D-এর সাথে সঠিক বা সামান্য রূপান্তরিত হয়। প্রশিক্ষণ সেটের আকার একইভাবে বজায় রাখা হয় প্রাথমিক তথ্য, কিন্তু দৃষ্টান্তগুলির বিতরণ অভিন্ন হতে পারে না, যেমন, কিছু দৃষ্টান্ত প্রশিক্ষণ সেটে বিভিন্ন সময়ে ঘটতে পারে, অন্যগুলি একবারও ঘটতে পারে না৷


  1. C# এ থ্রেড ক্লাসের পদ্ধতি এবং বৈশিষ্ট্যগুলি কী কী?

  2. C# এ ক্লাস পদ্ধতি এবং ক্লাস সদস্যদের মধ্যে পার্থক্য কী?

  3. জাভা 9-এ একটি ঐচ্ছিক ক্লাসে নতুন পদ্ধতিগুলি কী যোগ করা হয়েছে?

  4. পাইথন ক্লাসের জন্য গেটার/সেটার পদ্ধতিগুলি কী কী?