CART হল একটি বিখ্যাত ডিসিশন ট্রি অ্যালগরিদম যা প্রথম 1984 সালে লিও ব্রেইম্যান, জেরোম ফ্রিডম্যান, রিচার্ড ওলশেন এবং চার্লস স্টোন দ্বারা উত্পাদিত হয়। CART শ্রেণীবিভাগ এবং রিগ্রেশন ট্রি প্রতিনিধিত্ব করে। CART অ্যালগরিদম বাইনারি ট্রি উন্নত করে এবং বিভক্ত করা অব্যাহত রাখে কারণ নতুন বিভাজন পাওয়া যেতে পারে যা বিশুদ্ধতা উন্নত করে।
কিছু সহজ সাবট্রি আছে, যার প্রত্যেকটি মডেল জটিলতা এবং প্রশিক্ষণ গোষ্ঠীর ভুল শ্রেণীবিভাগের হারের মধ্যে আলাদা ট্রেড-অফ সংজ্ঞায়িত করে। CART অ্যালগরিদম প্রার্থী মডেল হিসাবে এই ধরনের subtrees একটি গ্রুপ স্বীকৃতি. এই প্রার্থী সাবট্রিগুলিকে বৈধতা গোষ্ঠীতে ব্যবহার করা হয় এবং ন্যূনতম বৈধতা সেটের ভুল শ্রেণিবিন্যাসের হার সহ ট্রিকে শেষ মডেল হিসাবে বেছে নেওয়া হয়৷
CART অ্যালগরিদম বারবার ছাঁটাইয়ের পদ্ধতির মাধ্যমে প্রার্থী সাবট্রিকে চিনতে পারে। উদ্দেশ্য হল প্রতি পাতায় ন্যূনতম বেশি ভবিষ্যদ্বাণী করার ক্ষমতা সমর্থনকারী শাখাগুলিকে প্রথমে ছাঁটাই করা। এটি এই ন্যূনতম উপকারী শাখাগুলিকে চিনতে পারে, CART একটি ধারণার উপর ভিত্তি করে যা সমন্বয় করা ত্রুটির হার হিসাবে পরিচিত৷
এটি এমন একটি পরিমাপ যা গাছের একাধিক পাতার উপর নির্ভর করে চিত্তাকর্ষক জটিলতা জরিমানা দ্বারা সেট করা প্রশিক্ষণে প্রতিটি নোডের ভুল শ্রেণীবিভাগের খরচ উন্নত করে। সামঞ্জস্য করা ত্রুটির হার দুর্বল শাখা চিহ্নিত করতে পারে (যাদের ভুল শ্রেণীবিভাগের হার শাস্তি অতিক্রম করার জন্য পর্যাপ্ত নয়) এবং ছাঁটাইয়ের জন্য তাদের নির্দেশ করতে পারে।
পরবর্তী কাজ হল প্রার্থী সাবট্রির পুল থেকে বেছে নেওয়া, যেটি নতুন রেকর্ডে সেরা কাজ করে। প্রতিটি প্রার্থী উপবৃক্ষ বৈধকরণ সেটে ডেটা সংজ্ঞায়িত করতে পারে। যে গাছটি সর্বনিম্ন সম্পূর্ণ ত্রুটির হার সহ এই কাজটি বাস্তবায়ন করে তাকে বিজয়ী হিসাবে সংজ্ঞায়িত করা হয়। ওভারট্রেনিংয়ের প্রভাব দূর করার জন্য বিজয়ী সাবট্রিকে পর্যাপ্তভাবে ছাঁটাই করা হয়েছে, তবে মূল্যবান ডেটা হারানোর জন্য খুব বেশি নয়৷
কারণ এই ছাঁটাইয়ের অ্যালগরিদমটি ভুল শ্রেণীবিভাগের হারের উপর নির্ভর করে, প্রতিটি শ্রেণীবিভাগের সম্ভাব্যতা বিবেচনায় না নিয়েই, এটি কিছু উপবৃক্ষ পুনরুদ্ধার করে যার পাতাগুলি একটি সাধারণ অভিভাবকের সাথে একই শ্রেণীবিভাগ তৈরি করে যা সেই শ্রেণীবিভাগও তৈরি করে।
উদ্দেশ্য হল ডেটার একটি ছোট অনুপাত বেছে নেওয়া (উদাহরণস্বরূপ, শীর্ষ 1 শতাংশ বা 10 শতাংশ), এই ছাঁটাই অ্যালগরিদম গাছের বাস্তবায়নকে ক্ষতিগ্রস্থ করতে পারে, কারণ কিছু বাদ দেওয়া পাতায় লক্ষ্য শ্রেণীর একটি খুব উচ্চ এলাকা অন্তর্ভুক্ত রয়েছে। . এসএএস এন্টারপ্রাইজ মাইনার সহ বিভিন্ন সরঞ্জাম রয়েছে যা ব্যবহারকারীকে এই ধরনের পদ্ধতির জন্য সর্বোত্তমভাবে গাছ ছাঁটাই করতে সক্ষম করে।
বিজয়ী সাবট্রিটি তার সম্পূর্ণ ত্রুটির হারের ভিত্তিতে বেছে নেওয়া হয়েছিল যখন বৈধকরণ সেটে ডেটা সংজ্ঞায়িত করার কাজে ব্যবহার করা হয়েছিল। এটি আশা করতে পারে যে নির্বাচিত সাবট্রি সেরা বাস্তবায়নকারী সাবট্রি হিসাবে চলতে থাকবে যখন একাধিক ডেটাসেটে ব্যবহার করা হয়, এটি নির্বাচন করার জন্য তৈরি করা ত্রুটির হার এটির শক্তিকে সামান্য বাড়াতে পারে৷