একটি শ্রেণিবদ্ধ ক্লাস্টারিং পদ্ধতি ডেটা অবজেক্টকে ক্লাস্টারের একটি গাছে একত্রিত করে কাজ করে। হায়ারার্কিকাল ক্লাস্টারিং অ্যালগরিদম হল টপ-ডাউন বা বটম-আপ। সঠিক শ্রেণিবিন্যাসের ক্লাস্টারিং কৌশলগুলির বৈশিষ্ট্যটি সামঞ্জস্য সম্পাদনের অভাব থেকে ক্ষয়প্রাপ্ত হয় কারণ একটি একত্রিত বা বিভক্ত করার সিদ্ধান্ত সম্পূর্ণ হয়৷
শ্রেণিবদ্ধ ক্লাস্টারিংয়ের বিভিন্ন উপাদান রয়েছে যা নিম্নরূপ -
একটি বিশ্বব্যাপী উদ্দেশ্য ফাংশনের অভাব
সমষ্টিগত অনুক্রমিক ক্লাস্টারিং পদ্ধতিগুলি স্থানীয়ভাবে সিদ্ধান্ত নিতে বিভিন্ন উপাদান ব্যবহার করে, প্রতিটি ধাপে, কোন ক্লাস্টারগুলিকে একত্রিত করতে হবে (বা বিভাজনমূলক পদ্ধতির জন্য বিভক্ত)।
এই পদ্ধতিতে ক্লাস্টারিং অ্যালগরিদম পাওয়া যায় যা একটি জটিল সমন্বয়মূলক অপ্টিমাইজেশান সমস্যা সমাধানের জন্য উদ্যোগ নেওয়ার অসুবিধা রোধ করে৷
বিভিন্ন ক্লাস্টার মাপ পরিচালনা করার ক্ষমতা
সমষ্টিগত শ্রেণিবিন্যাস ক্লাস্টারিংয়ের উপাদান যা একত্রিত করা ক্লাস্টারগুলির গোষ্ঠীর সহযোগী আকারগুলিকে কীভাবে বিবেচনা করতে হয়। এটি শুধুমাত্র ক্লাস্টার প্রক্সিমিটি স্কিমগুলিতে ব্যবহার করে যাতে যোগফল থাকে, যেমন সেন্ট্রোয়েড, ওয়ার্ডস এবং গ্রুপ গড়৷
দুটি পদ্ধতি রয়েছে যেমন ওজনযুক্ত, যা সমস্ত ক্লাস্টারকে সমানভাবে বিবেচনা করে এবং ওজনহীন, যা অ্যাকাউন্টে প্রতিটি ক্লাস্টারে পয়েন্টের সংখ্যা তৈরি করে। ওয়েটেড বা আনওয়েটেডের পরিভাষা ডেটা পয়েন্টকে সংজ্ঞায়িত করে, ক্লাস্টার নয়। অন্য পদে, অসম আকারের ক্লাস্টার বিবেচনা করলে বিভিন্ন ক্লাস্টারের পয়েন্টগুলিতে সমানভাবে একাধিক ওজন পাওয়া যায়, যখন অ্যাকাউন্টে ক্লাস্টারের আকার তৈরি করা হয় তখন বিভিন্ন ক্লাস্টারে একই ওজনের পয়েন্ট প্রদান করে।
একত্রীকরণের সিদ্ধান্ত চূড়ান্ত
সমষ্টিগত শ্রেণিবিন্যাস ক্লাস্টারিং অ্যালগরিদম দুটি ক্লাস্টারকে একত্রিত করার বিষয়ে ভাল স্থানীয় সিদ্ধান্তগুলি তৈরিতে প্রভাবিত করে কারণ তাদের সমস্ত পয়েন্টের জোড়া সাদৃশ্য সম্পর্কে ডেটার প্রয়োজন হতে পারে। কারণ দুটি ক্লাস্টার একত্রিত করার সিদ্ধান্ত নেওয়া হয়েছে, এটি পরবর্তী সময়ে পূর্বাবস্থায় ফেরানো যাবে না। এই পদ্ধতিটি একটি স্থানীয় অপ্টিমাইজেশান উপাদানকে বিশ্বব্যাপী অপ্টিমাইজেশান মানদণ্ডে পরিণত হওয়া থেকে এড়ায়৷
উদাহরণস্বরূপ, যদিও ওয়ার্ডের পদ্ধতিতে কোন ক্লাস্টারগুলিকে একত্রিত করতে হবে তা নির্ধারণ করতে K-মান থেকে "মিনিমাইজ স্কোয়ারড ত্রুটি" মানদণ্ড ব্যবহার করা হয়, তবে প্রতিটি স্তরের ক্লাস্টারগুলি মোট SSE সম্পর্কিত স্থানীয় মিনিমাম সংজ্ঞায়িত করে না। প্রকৃতপক্ষে, ক্লাস্টারগুলি গতিশীল নয়, এই অর্থে যে একটি ক্লাস্টারের একটি বিন্দু তার সাম্প্রতিক ক্লাস্টারের সেন্ট্রোয়েডের চেয়ে ভিন্ন ক্লাস্টারের সেন্ট্রোয়েডের কাছাকাছি হতে পারে৷
কিছু পদ্ধতি যা একত্রিত হওয়া সীমাবদ্ধতা অতিক্রম করার চেষ্টা করে তা চূড়ান্ত। একটি পদ্ধতি বিশ্বব্যাপী উদ্দেশ্যমূলক ফাংশন উন্নত করার জন্য চারপাশে গাছের শাখাগুলি সংশোধন করে শ্রেণিবদ্ধ ক্লাস্টারিং সজ্জিত করার চেষ্টা করে। আরেকটি পদ্ধতিতে কিছু ছোট ক্লাস্টার তৈরি করার জন্য Kmeans সহ একটি পার্টিশনাল ক্লাস্টারিং কৌশল প্রয়োজন এবং তারপর এই ছোট ক্লাস্টারগুলিকে প্রারম্ভিক পয়েন্ট হিসাবে ব্যবহার করে শ্রেণিবদ্ধ ক্লাস্টারিং প্রয়োগ করা।