ডিসিশন ট্রি হল একটি ফ্লো-চার্ট-এর মতো ট্রি মেকানিজম, যেখানে প্রতিটি অভ্যন্তরীণ নোড একটি অ্যাট্রিবিউটের উপর একটি পরীক্ষা নির্দেশ করে, প্রতিটি বিভাগ পরীক্ষার ফলাফল নির্ধারণ করে এবং লিফ নোডগুলি ক্লাস বা ক্লাস ডিস্ট্রিবিউশন বর্ণনা করে। গাছের সর্বোচ্চ নোড হল রুট নোড৷
ডিসিশন ট্রি শেখার জন্য অ্যালগরিদম
অ্যালগরিদম - প্রদত্ত প্রশিক্ষণ তথ্য থেকে একটি সিদ্ধান্ত গাছ তৈরি করুন৷
৷ইনপুট - প্রশিক্ষণের নমুনা, নমুনা, বিচ্ছিন্ন-মূল্যবান বৈশিষ্ট্য দ্বারা বর্ণিত; স্টুডেন্ট অ্যাট্রিবিউটের সেট, অ্যাট্রিবিউট-লিস্ট।
আউটপুট - একটি সিদ্ধান্ত গাছ।
পদ্ধতি
-
একটি নোড তৈরি করুন N;
-
যদি সমস্ত নমুনা একই শ্রেণীর হয়, তাহলে C
-
ক্লাস C
লেবেলযুক্ত একটি লিফ নোড হিসাবে N ফেরত দিন -
যদি বৈশিষ্ট্য-তালিকাটি শূন্য হয় তাহলে
-
নমুনাগুলিতে সবচেয়ে সাধারণ শ্রেণীর লেবেলযুক্ত একটি লিফ নোড হিসাবে N ফেরত দিন। // সংখ্যাগরিষ্ঠ ভোট
-
পরীক্ষা-বিশিষ্ট নির্বাচন করুন, সর্বাধিক তথ্য লাভ সহ বৈশিষ্ট্য-তালিকার মধ্যে বৈশিষ্ট্য।
-
টেস্ট অ্যাট্রিবিউট সহ নোড N লেবেল করুন।
-
টেস্ট-অ্যাট্রিবিউটের প্রতিটি পরিচিত মানের জন্য // নমুনা পার্টিশন করুন।
-
শর্ত test-attribute=ai এর জন্য নোড N থেকে একটি শাখা বাড়ান .
-
চলুন si নমুনার নমুনার সেট হতে হবে যার জন্য test-attribute=ai .
-
যদি si খালি থাকে তাহলে
-
এটি নমুনার সবচেয়ে সাধারণ শ্রেণীর সাথে লেবেলযুক্ত একটি পাতাকে সংযুক্ত করতে পারে।
-
অন্যথায় জেনারেট ডিসিশন ট্রি (si,attribute-list - test-attribute) দ্বারা প্রত্যাবর্তিত নোডটি সংযুক্ত করুন
ডিসিশন ট্রি ইন্ডাকশন
উদাহরণস্বরূপ সিদ্ধান্তের নিয়মগুলির স্বয়ংক্রিয় উত্পাদনকে নিয়ম আনয়ন বা স্বয়ংক্রিয় নিয়ম আনয়ন হিসাবে উল্লেখ করা হয়। এটি সিদ্ধান্ত গাছের অন্তর্নিহিত নকশায় সিদ্ধান্তের নিয়ম তৈরি করতে পারে যা প্রায়শই নিয়ম আনয়ন হিসাবেও পরিচিত, তবে ট্রি ইনডাকশন বা ডিসিশন ট্রি ইনডাকশন শব্দগুলি ক্রমাগত বেছে নেওয়া হয়৷
সিদ্ধান্ত গাছ আনয়নের জন্য মৌলিক অ্যালগরিদম হল একটি লোভী অ্যালগরিদম। এটি টপ-ডাউন রিকারসিভ ডিভাইড-এন্ড-কনকার পদ্ধতিতে ডিসিশন ট্রি তৈরি করতে ব্যবহৃত হয়। সিদ্ধান্ত গাছ শেখার জন্য মৌলিক অ্যালগরিদম হল ID3 এর একটি রূপ, একটি বিখ্যাত ডিসিশন ট্রি ইনডাকশন অ্যালগরিদম৷
মৌলিক পদ্ধতিগুলি নিম্নরূপ -
-
গাছটি প্রশিক্ষণের নমুনাগুলিকে সংজ্ঞায়িত করে একটি পৃথক নোড হিসাবে শুরু হয়৷
-
যদি নমুনাগুলি একই শ্রেণীর হয়, তাহলে নোডটি একটি পাতায় পরিণত হয় এবং সেই শ্রেণীর সাথে লেবেল করা হয়৷
-
অ্যালগরিদম একটি এনট্রপি-ভিত্তিক পরিমাপ প্রয়োগ করে যা নমুনাগুলিকে একক শ্রেণিতে বিভক্ত করবে এমন বৈশিষ্ট্য বেছে নেওয়ার জন্য হিউরিস্টিক হিসাবে তথ্য লাভ হিসাবে উল্লেখ করা হয়। এই বৈশিষ্ট্যটি নোডে "পরীক্ষা" বা "সিদ্ধান্ত" বৈশিষ্ট্যে বিকশিত হয়। অ্যালগরিদমের এই ফর্মে, সমস্ত বৈশিষ্ট্যগুলি শ্রেণীবদ্ধ, যেমন, বিচ্ছিন্ন-মূল্যবান৷ ক্রমাগত মূল্যবান বৈশিষ্ট্যগুলিকে আলাদা করা উচিত৷
-
পরীক্ষার বৈশিষ্ট্যের প্রতিটি পরিচিত মানের জন্য একটি বিভাগ তৈরি করা হয় এবং নমুনাগুলি যথাযথভাবে ভাগ করা হয়৷
-
অ্যালগরিদম একটি অনুরূপ প্রক্রিয়া লুপিং ব্যবহার করে প্রতিটি বিচ্ছেদে নমুনার জন্য একটি সিদ্ধান্ত গাছ গঠন করে। কারণ একটি নোডে একটি বৈশিষ্ট্য উপস্থিত হয়েছে, এটি নোডের কিছু বংশধরদের মধ্যে চিকিত্সা করা আবশ্যক নয়৷