ব্যাগিং
ব্যাগিং বুটস্ট্র্যাপ অ্যাগ্রিগেশন নামেও পরিচিত। এটি হল একত্রিত শেখার পদ্ধতি যা সাধারণত একটি গোলমাল ডেটাসেটের মধ্যে পার্থক্য কমাতে ব্যবহৃত হয়। ব্যাগিং-এ, প্রশিক্ষণ সেটে ডেটার একটি র্যান্ডম নমুনা প্রতিস্থাপনের সাথে নির্বাচন করা হয় যার অর্থ একক ডেটা পয়েন্ট একাধিকবার নির্বাচন করা যেতে পারে।
বেশ কয়েকটি ডেটা নমুনা তৈরি করার পরে, এই দুর্বল মডেলগুলি আলাদাভাবে প্রশিক্ষিত হয় এবং টাস্ক রিগ্রেশন বা শ্রেণীবিভাগের উপাদানের উপর নির্ভর করে। উদাহরণস্বরূপ, এই ভবিষ্যদ্বাণীগুলির গড় একটি আরও দক্ষ অনুমান দেয়৷
৷র্যান্ডম ফরেস্ট হল ব্যাগিংয়ের উপর একটি এক্সটেনশন। রেকর্ডের একটি এলোমেলো উপসেটের ভবিষ্যদ্বাণী করতে এটি আরও একটি পদক্ষেপ নেয়। এটি গাছ বিকাশের জন্য সমস্ত বৈশিষ্ট্য ব্যবহার করার পরিবর্তে বৈশিষ্ট্যগুলির একটি এলোমেলো নির্বাচন তৈরি করে। যখন এটিতে বেশ কয়েকটি এলোমেলো গাছ থাকতে পারে, তখন এটি র্যান্ডম ফরেস্ট নামে পরিচিত।
ফাইন্যান্স মার্কেটে ডিপ লার্নিং মডেলের সাহায্যে ব্যাগিং করা হয়েছে, স্বয়ংক্রিয় গুরুত্বপূর্ণ ফাংশন যেমন জালিয়াতি সনাক্তকরণ, ক্রেডিট রিস্ক কম্পিউটেশন এবং বিকল্প মূল্য সংক্রান্ত সমস্যা।
এই গবেষণাটি দেখায় যে কীভাবে ঋণ খেলাপি ঝুঁকি তৈরি করতে বিভিন্ন মেশিন লার্নিং কৌশলগুলির মধ্যে ব্যাগিং করা হয়েছে। এই অধ্যয়নটি বোঝায় যে ব্যাকিং এবং আর্থিক প্রতিষ্ঠানের মধ্যে ক্রেডিট কার্ড জালিয়াতি এড়ানোর মাধ্যমে ব্যাগিং কীভাবে ঝুঁকি কমাতে সহায়তা করে৷
বুস্টিং
বুস্টিং হল ভবিষ্যদ্বাণীকারীদের একটি সেট তৈরি করার আরেকটি সংমিশ্রণ প্রক্রিয়া। অন্য পদে, এটি পরপর গাছের সাথে মানানসই হতে পারে, সাধারণত এলোমেলো নমুনা, এবং প্রতিটি পর্যায়ে, উদ্দেশ্য হল পূর্ববর্তী গাছ থেকে নেট ত্রুটি সমাধান করা।
বুস্টিং সাধারণত তত্ত্বাবধানে শেখার কৌশলে পক্ষপাত ও বৈচিত্র্য কমাতে ব্যবহৃত হয়। এটি একটি অ্যালগরিদমের পরিবারকে সংজ্ঞায়িত করে যা দুর্বল শিক্ষার্থীদের (বেস লার্নার্স) থেকে শক্তিশালী শিক্ষার্থীদের পরিবর্তন করে। দুর্বল শিক্ষার্থী হল সেই শ্রেণীবিভাগকারী যা প্রকৃত শ্রেণীবিভাগের সাথে সামান্য পরিমাণ পর্যন্তই সঠিক, যখন শক্তিশালী শিক্ষার্থী হল সেই শ্রেণীবিভাগকারী যারা প্রকৃত শ্রেণীবিভাগের সাথে ভালোভাবে সম্পর্কযুক্ত।
আসুন ব্যাগিং এবং বুস্টিং এর মধ্যে তুলনা দেখি।
ব্যাগিং | বুস্টিং |
---|---|
ভেদ কমানোর উদ্দেশ্য, পক্ষপাত নয়। | পক্ষপাত কমানোর উদ্দেশ্য, ভিন্নতা নয়। |
প্রতিটি মডেল স্বাধীনভাবে নির্মিত। | নতুন মডেলগুলি পূর্বে উন্নত মডেলের বাস্তবায়ন দ্বারা প্রভাবিত হয়৷ | ৷
এটি একই ধরনের ভবিষ্যদ্বাণী সংযুক্ত করার সবচেয়ে সহজ উপায়। | এটি পূর্বাভাস সংযুক্ত করার একটি পদ্ধতি যা একাধিক প্রকারের সাথে সম্পর্কিত৷ | ৷
ব্যাগিং ওভার-ফিটিং সমস্যা মোকাবেলা করার চেষ্টা করে। | বুস্টিং পক্ষপাত কমানোর চেষ্টা করে। |
পুরো প্রশিক্ষণ ডেটাসেট থেকে প্রতিস্থাপনের সাথে বেশ কিছু প্রশিক্ষণ ডেটা উপসেট এলোমেলোভাবে আঁকা হয়৷ | প্রতিটি নতুন সাবসেটে এমন উপাদান রয়েছে যা পূর্ববর্তী মডেলগুলির দ্বারা ভুল শ্রেণিবদ্ধ করা হয়েছিল৷ |
ব্যাগিং ওভার-ফিটিং সমস্যার সমাধান করতে পারে। | বুস্টিং ওভার-ফিটিং সমস্যাকে বাড়িয়ে তুলতে পারে। |