ডিসিশন ট্রি ইনডাকশন হল ক্লাস-লেবেল করা ট্রেনিং টিপল থেকে ডিসিশন ট্রি শেখা। একটি সিদ্ধান্ত গাছ একটি ক্রমিক চিত্রের মতো গাছের কাঠামো, যেখানে প্রতিটি অভ্যন্তরীণ নোড (নন-লিফ নোড) একটি বৈশিষ্ট্যের উপর একটি পরীক্ষা নির্দেশ করে, প্রতিটি শাখা পরীক্ষার ফলাফল নির্ধারণ করে এবং প্রতিটি পাতার নোড (বা টার্মিনাল নোড) একটি শ্রেণিকে প্রভাবিত করে। লেবেল একটি গাছের বৃহত্তম নোড হল রুট নোড৷
ডিসিশন ট্রি ইনডাকশন একটি ফ্লোচার্ট-এর মতো কাঠামো তৈরি করে যেখানে প্রতিটি অভ্যন্তরীণ (নন-লিফ) নোড একটি বৈশিষ্ট্যের উপর একটি পরীক্ষা নির্দেশ করে, প্রতিটি শাখা পরীক্ষার ফলাফলের সাথে মিলে যায় এবং প্রতিটি বহিরাগত (পাতা) নোড একটি শ্রেণির পূর্বাভাস নির্দেশ করে।
প্রতিটি নোডে, অ্যালগরিদম ডেটাকে একক শ্রেণীতে ভাগ করার জন্য "সেরা" বৈশিষ্ট্য নির্বাচন করে। যখন ডিসিশন ট্রি ইনডাকশন অ্যাট্রিবিউট সাবসেট নির্বাচনের জন্য ব্যবহার করা হয়, তখন প্রদত্ত ডেটা থেকে একটি ট্রি তৈরি হয়।
কিছু বৈশিষ্ট্য যা গাছে ঘটে না তা অপ্রাসঙ্গিক বলে বিবেচিত হয়৷ গাছে ঘটতে থাকা বৈশিষ্ট্যগুলির সেটটি বৈশিষ্ট্যগুলির হ্রাসকৃত উপসেট গঠন করে। ডিসিশন ট্রি ইন্ডাকশন অ্যালগরিদম একটি অ্যাট্রিবিউট পরীক্ষার শর্ত এবং একাধিক অ্যাট্রিবিউট প্রকারের জন্য এর পারস্পরিক সম্পর্কযুক্ত ফলাফল নির্ধারণের জন্য একটি পদ্ধতিকে সমর্থন করে৷
বাইনারী বৈশিষ্ট্য − একটি বাইনারি অ্যাট্রিবিউট হল একটি নামমাত্র অ্যাট্রিবিউট যেখানে 0 বা 1 সহ মাত্র দুটি উপাদান বা অবস্থা রয়েছে, যেখানে 0 প্রায়শই প্রতিনিধিত্ব করে যে অ্যাট্রিবিউটটি অনুপস্থিত, এবং 1 প্রতিনিধিত্ব করে যে এটি উপস্থিত রয়েছে। বাইনারি বৈশিষ্ট্যগুলিকে বুলিয়ান হিসাবে সংজ্ঞায়িত করা হয় যদি দুটি অবস্থা সত্য এবং মিথ্যার সমান হয়৷
একটি বাইনারি অ্যাট্রিবিউট প্রতিসম হয় যদি এর উভয় অবস্থাই সমান মূল্যবান হয় এবং সমান ওজন করে। কোন পছন্দ নেই যার ফলাফল 0 বা 1 হিসাবে কোড করতে হবে৷ একটি উদাহরণ হতে পারে অ্যাট্রিবিউট লিঙ্গ যেখানে পুরুষ এবং মহিলা রাজ্য রয়েছে৷
একটি বাইনারি অ্যাট্রিবিউট অসমমিত হয় যদি রাজ্যের ফলাফলগুলি সমানভাবে অপরিহার্য না হয়, যেমন এইচআইভির জন্য একটি মেডিকেল পরীক্ষার ইতিবাচক এবং নেতিবাচক ফলাফল। নিয়ম অনুসারে, এটি সবচেয়ে প্রয়োজনীয় ফলাফল কোড করতে পারে, যা সাধারণত 1 দ্বারা (যেমন, এইচআইভি পজিটিভ) এবং 0 দ্বারা ভিন্ন (যেমন, এইচআইভি নেতিবাচক) হয়।
নামমাত্র বৈশিষ্ট্য − নামমাত্র নামের সাথে যুক্ত করাকে সংজ্ঞায়িত করে। একটি নামমাত্র বৈশিষ্ট্যের মান হল প্রতীক বা জিনিসের নাম। প্রতিটি মান কিছু ধরণের বিভাগ, কোড, বা রাষ্ট্র ইত্যাদিকে সংজ্ঞায়িত করে৷ নামমাত্র বৈশিষ্ট্যগুলিকে শ্রেণীবদ্ধ হিসাবে সংজ্ঞায়িত করা হয়৷ মানগুলির কোন উল্লেখযোগ্য ক্রম নেই। কম্পিউটার বিজ্ঞানে, মানকে গণনাও বলা হয়।
আর্ডিনাল অ্যাট্রিবিউটস − একটি অর্ডিনাল অ্যাট্রিবিউট হল প্রযোজ্য মান সহ একটি অ্যাট্রিবিউট যার মধ্যে একটি অপরিহার্য সিরিজ বা র্যাঙ্কিং রয়েছে, কিন্তু ধারাবাহিক মানের মধ্যে মাত্রা অজানা৷
অর্ডিনাল অ্যাট্রিবিউট বাইনারি বা মাল্টিওয়ে স্প্লিট করতে পারে। গোষ্ঠীগত বৈশিষ্ট্যের মানগুলির ক্রম প্রকৃতি লঙ্ঘন করে না বিবেচনা করে সাধারণ বৈশিষ্ট্যের মানগুলি একত্রিত করা যেতে পারে।
সাংখ্যিক গুণাবলী - একটি সংখ্যাসূচক বৈশিষ্ট্য পরিমাণগত। এটি একটি গণনাযোগ্য পরিমাণ, যা সংখ্যাসূচক বা বাস্তব মানগুলিতে উপস্থাপিত হয়। এটি ব্যবধান-স্কেল বা অনুপাত-স্কেল করা যেতে পারে।