দুটি ধরণের পার্টিশনাল অ্যালগরিদম রয়েছে যা নিম্নরূপ -
K- মানে ক্লাস্টারিং − K- মানে ক্লাস্টারিং হল সবচেয়ে সাধারণ পার্টিশনিং অ্যালগরিদম। কে-মানে গঠিত নতুন ক্লাস্টারগুলির একটিতে ডেটাসেটের প্রতিটি ডেটা পুনরায় বরাদ্দ করে৷ দূরত্ব বা সাদৃশ্যের পরিমাপ ব্যবহার করে একটি রেকর্ড বা ডেটা পয়েন্ট নিকটতম ক্লাস্টারে বরাদ্দ করা হয়। K-মানে ক্লাস্টারিং-এ নিম্নলিখিত ধাপগুলি ব্যবহার করা হয়েছে:
-
এটি K প্রাথমিক ক্লাস্টার সেন্ট্রোয়েড c1 নির্বাচন করতে পারে , c2 , c3 ... ck .
-
এটি এস ক্লাস্টারে প্রতিটি ইনস্ট্যান্স x বরাদ্দ করতে পারে যার সেন্ট্রোয়েড x এর সবচেয়ে কাছাকাছি।
-
প্রতিটি ক্লাস্টারের জন্য, সেই ক্লাস্টারে কোন উপাদানগুলি রয়েছে তার উপর ভিত্তি করে তার সেন্ট্রোয়েড পুনরায় গণনা করুন৷
-
কনভারজেন্স সম্পূর্ণ না হওয়া পর্যন্ত (b) এ যান।
-
এটি অবজেক্টকে (ডেটা পয়েন্ট) কে ক্লাস্টারে আলাদা করতে পারে।
-
এটি ক্লাস্টার সেন্টার (সেন্ট্রয়েড) =ক্লাস্টারের সমস্ত ডেটা পয়েন্টের গড় হিসাবে ব্যবহৃত হয়।
-
এটি প্রতিটি পয়েন্টকে ক্লাস্টারে বরাদ্দ করতে পারে যার সেন্ট্রোয়েড সবচেয়ে কাছের (দূরত্ব ফাংশন ব্যবহার করে)।
উপায়গুলির জন্য প্রাথমিক মানগুলি নির্বিচারে বরাদ্দ করা হয়। এগুলি এলোমেলোভাবে বরাদ্দ করা যেতে পারে বা সম্ভবত প্রথম k ইনপুট আইটেমগুলি থেকে মানগুলি ব্যবহার করতে পারে৷ কনভারজেন্স উপাদানটি বর্গক্ষেত্র ত্রুটির উপর ভিত্তি করে হতে পারে, কিন্তু সেগুলি না হওয়া প্রয়োজন৷ উদাহরণস্বরূপ, অ্যালগরিদম বিভিন্ন ক্লাস্টারে বরাদ্দ করা হয়। অন্যান্য সমাপ্তি কৌশলগুলি কেবল একটি নির্দিষ্ট সংখ্যক পুনরাবৃত্তিতে লক করা হয়েছে। কনভারজেন্স ছাড়াই কেনাকাটা নিশ্চিত করতে সর্বাধিক সংখ্যক পুনরাবৃত্তি অন্তর্ভুক্ত করা যেতে পারে।
অ্যালগরিদম
ইনপুট
D = {t1t2 ... tn} // Set of elements k // Number of desired clusters
আউটপুট
K // Set of clusters
K- মানে অ্যালগরিদম -
মানে m1 এর জন্য প্রাথমিক মান নির্ধারণ করুন m2 ... mk
পুনরাবৃত্তি করুন
প্রতিটি আইটেম টি ক্লাস্টারে বরাদ্দ করুন যার নিকটতম গড় রয়েছে
প্রতিটি ক্লাস্টারের জন্য নতুন গড় গণনা করুন
অভিন্নতার মানদণ্ড পূরণ না হওয়া পর্যন্ত
নিকটতম প্রতিবেশী অ্যালগরিদম৷ − একটি অ্যালগরিদম যা একক লিঙ্ক কৌশলের অনুরূপ তাকে নিকটতম প্রতিবেশী অ্যালগরিদম বলা হয়। এই সিরিয়াল অ্যালগরিদমের সাহায্যে, আইটেমগুলি পুনরাবৃত্তভাবে বর্তমান ক্লাস্টারগুলির সাথে মিলিত হয় যা সবচেয়ে কাছের। এই অ্যালগরিদমে, একটি থ্রেশহোল্ড টি নির্ধারণ করতে পারে যে আইটেমগুলি বিদ্যমান ক্লাস্টারগুলিতে ঢোকানো হবে বা একটি নতুন ক্লাস্টার তৈরি করা হবে কিনা৷
অ্যালগরিদম
ইনপুট
D = {t1t2 ... tn} // Set of elements A // Adjacency matrix showing distance between elements
আউটপুট
K // Set of clusters Nearest neighbour algorithm K1 = {t1}; K = {K1}; k = 1; for i = 2 to n do find the tm in some cluster Km in K such that dis {ti, tm} is the smallest; If dis {ti, tm} $\leqslant$ t then Km = Km $\cup$ ti else k = k + 1; Kk = {ti}