কম্পিউটার

CART প্রুনিং অ্যালগরিদম কি?


CART হল একটি বিখ্যাত ডিসিশন ট্রি অ্যালগরিদম যা প্রথম 1984 সালে লিও ব্রেইম্যান, জেরোম ফ্রিডম্যান, রিচার্ড ওলশেন এবং চার্লস স্টোন দ্বারা উত্পাদিত হয়। CART শ্রেণীবিভাগ এবং রিগ্রেশন ট্রি প্রতিনিধিত্ব করে। CART অ্যালগরিদম বাইনারি ট্রি উন্নত করে এবং বিভক্ত করা অব্যাহত রাখে কারণ নতুন বিভাজন পাওয়া যেতে পারে যা বিশুদ্ধতা উন্নত করে।

কিছু সহজ সাবট্রি আছে, যার প্রত্যেকটি মডেল জটিলতা এবং প্রশিক্ষণ গোষ্ঠীর ভুল শ্রেণীবিভাগের হারের মধ্যে আলাদা ট্রেড-অফ সংজ্ঞায়িত করে। CART অ্যালগরিদম প্রার্থী মডেল হিসাবে এই ধরনের subtrees একটি গ্রুপ স্বীকৃতি. এই প্রার্থী সাবট্রিগুলিকে বৈধতা গোষ্ঠীতে ব্যবহার করা হয় এবং ন্যূনতম বৈধতা সেটের ভুল শ্রেণিবিন্যাসের হার সহ ট্রিকে শেষ মডেল হিসাবে বেছে নেওয়া হয়৷

CART অ্যালগরিদম বারবার ছাঁটাইয়ের পদ্ধতির মাধ্যমে প্রার্থী সাবট্রিকে চিনতে পারে। উদ্দেশ্য হল প্রতি পাতায় ন্যূনতম বেশি ভবিষ্যদ্বাণী করার ক্ষমতা সমর্থনকারী শাখাগুলিকে প্রথমে ছাঁটাই করা। এটি এই ন্যূনতম উপকারী শাখাগুলিকে চিনতে পারে, CART একটি ধারণার উপর ভিত্তি করে যা সমন্বয় করা ত্রুটির হার হিসাবে পরিচিত৷

এটি এমন একটি পরিমাপ যা গাছের একাধিক পাতার উপর নির্ভর করে চিত্তাকর্ষক জটিলতা জরিমানা দ্বারা সেট করা প্রশিক্ষণে প্রতিটি নোডের ভুল শ্রেণীবিভাগের খরচ উন্নত করে। সামঞ্জস্য করা ত্রুটির হার দুর্বল শাখা চিহ্নিত করতে পারে (যাদের ভুল শ্রেণীবিভাগের হার শাস্তি অতিক্রম করার জন্য পর্যাপ্ত নয়) এবং ছাঁটাইয়ের জন্য তাদের নির্দেশ করতে পারে।

পরবর্তী কাজ হল প্রার্থী সাবট্রির পুল থেকে বেছে নেওয়া, যেটি নতুন রেকর্ডে সেরা কাজ করে। প্রতিটি প্রার্থী উপবৃক্ষ বৈধকরণ সেটে ডেটা সংজ্ঞায়িত করতে পারে। যে গাছটি সর্বনিম্ন সম্পূর্ণ ত্রুটির হার সহ এই কাজটি বাস্তবায়ন করে তাকে বিজয়ী হিসাবে সংজ্ঞায়িত করা হয়। ওভারট্রেনিংয়ের প্রভাব দূর করার জন্য বিজয়ী সাবট্রিকে পর্যাপ্তভাবে ছাঁটাই করা হয়েছে, তবে মূল্যবান ডেটা হারানোর জন্য খুব বেশি নয়৷

কারণ এই ছাঁটাইয়ের অ্যালগরিদমটি ভুল শ্রেণীবিভাগের হারের উপর নির্ভর করে, প্রতিটি শ্রেণীবিভাগের সম্ভাব্যতা বিবেচনায় না নিয়েই, এটি কিছু উপবৃক্ষ পুনরুদ্ধার করে যার পাতাগুলি একটি সাধারণ অভিভাবকের সাথে একই শ্রেণীবিভাগ তৈরি করে যা সেই শ্রেণীবিভাগও তৈরি করে।

উদ্দেশ্য হল ডেটার একটি ছোট অনুপাত বেছে নেওয়া (উদাহরণস্বরূপ, শীর্ষ 1 শতাংশ বা 10 শতাংশ), এই ছাঁটাই অ্যালগরিদম গাছের বাস্তবায়নকে ক্ষতিগ্রস্থ করতে পারে, কারণ কিছু বাদ দেওয়া পাতায় লক্ষ্য শ্রেণীর একটি খুব উচ্চ এলাকা অন্তর্ভুক্ত রয়েছে। . এসএএস এন্টারপ্রাইজ মাইনার সহ বিভিন্ন সরঞ্জাম রয়েছে যা ব্যবহারকারীকে এই ধরনের পদ্ধতির জন্য সর্বোত্তমভাবে গাছ ছাঁটাই করতে সক্ষম করে।

বিজয়ী সাবট্রিটি তার সম্পূর্ণ ত্রুটির হারের ভিত্তিতে বেছে নেওয়া হয়েছিল যখন বৈধকরণ সেটে ডেটা সংজ্ঞায়িত করার কাজে ব্যবহার করা হয়েছিল। এটি আশা করতে পারে যে নির্বাচিত সাবট্রি সেরা বাস্তবায়নকারী সাবট্রি হিসাবে চলতে থাকবে যখন একাধিক ডেটাসেটে ব্যবহার করা হয়, এটি নির্বাচন করার জন্য তৈরি করা ত্রুটির হার এটির শক্তিকে সামান্য বাড়াতে পারে৷


  1. তথ্য নিরাপত্তা ডিইএস অ্যালগরিদম কি?

  2. ব্লোফিশ অ্যালগরিদমের অপারেশনগুলি কী কী?

  3. Blowfish এনক্রিপশন অ্যালগরিদম কি?

  4. তথ্য নিরাপত্তা RSA অ্যালগরিদম কি?