একই বস্তুর শ্রেণীতে ভৌত বা বিমূর্ত বস্তুর সেটকে একত্রিত করার প্রক্রিয়াকে ক্লাস্টারিং বলা হয়। একটি ক্লাস্টার হল ডেটা অবজেক্টের একটি সেট যা একই ক্লাস্টারের মধ্যে একে অপরের মতো এবং অন্যান্য ক্লাস্টারের অবজেক্ট থেকে আলাদা। ডেটা অবজেক্টের একটি ক্লাস্টারকে বিভিন্ন অ্যাপ্লিকেশনে একটি গ্রুপ হিসাবে সম্মিলিতভাবে বিবেচনা করা যেতে পারে। ক্লাস্টার বিশ্লেষণ একটি অপরিহার্য মানব কার্যকলাপ।
ক্লাস্টারিং বহিরাগতদের সনাক্ত করতে সহায়তা করে। একই মানগুলি ক্লাস্টারে সংগঠিত হয় এবং যে মানগুলি ক্লাস্টারের বাইরে পড়ে সেগুলি আউটলায়ার হিসাবে পরিচিত। ক্লাস্টারিং কৌশলগুলি ডেটা টিপলকে অবজেক্ট হিসাবে বিবেচনা করে। তারা বস্তুগুলিকে গোষ্ঠী বা ক্লাস্টারে বিভক্ত করে যাতে একটি ক্লাস্টারের মধ্যে থাকা বস্তুগুলি একে অপরের সাথে "সদৃশ" এবং অন্যান্য ক্লাস্টারের বস্তুগুলির সাথে "বিচ্ছিন্ন" হয়। এটি সাধারণত দূরত্ব ফাংশনের উপর ভিত্তি করে, মহাকাশে বস্তুগুলি কতটা "কাছে" থাকে তার পরিপ্রেক্ষিতে সংজ্ঞায়িত করা হয়।
গ্রাফ-ভিত্তিক ক্লাস্টারিংয়ের বিভিন্ন পদ্ধতি রয়েছে যা নিম্নরূপ -
নিকটতম প্রতিবেশীদের সাথে একটি বস্তুর শুধুমাত্র লিঙ্ক বজায় রাখার জন্য প্রক্সিমিটি গ্রাফটিকে বিচ্ছিন্ন করুন। এই sparsification গোলমাল এবং বহিরাগতদের পরিচালনার জন্য উপকারী। এটি অত্যন্ত কার্যকর গ্রাফ পার্টিশনিং অ্যালগরিদম ব্যবহার করতে সক্ষম করে যা স্পার্স গ্রাফের জন্য তৈরি করা হয়েছে।
এটি কয়েকটি নিকটতম প্রতিবেশীর উপর ভিত্তি করে দুটি বস্তুর মধ্যে একটি সাদৃশ্য পরিমাপ উপস্থাপন করতে পারে যা তারা প্রেরণ করে। এই পদ্ধতিটি যা পর্যবেক্ষণের উপর নির্ভর করে যে একটি বস্তু এবং তার নিকটতম প্রতিবেশীরা সাধারণত একই শ্রেণীর অন্তর্গত, উচ্চমাত্রিকতা এবং পরিবর্তিত ঘনত্বের ক্লাস্টারগুলির সমস্যাগুলি অতিক্রম করার জন্য উপকারী৷
এটি মূল বস্তুর প্রতিনিধিত্ব করতে পারে এবং তাদের চারপাশে ক্লাস্টার বিকাশ করতে পারে। গ্রাফভিত্তিক ক্লাস্টারিং-এ, একটি প্রক্সিমিটি গ্রাফ বা স্পারসিফাইড প্রক্সিমিটি গ্রাফের উপর ঘনত্ব-ভিত্তিক একটি ধারণা প্রবর্তন করা অপরিহার্য। DBSCAN-এর মতো, মূল বস্তুর চারপাশে ক্লাস্টারের বিকাশ একটি ক্লাস্টারিং পদ্ধতির দিকে নিয়ে যায় যা বিভিন্ন আকার এবং আকারের ক্লাস্টার আবিষ্কার করতে পারে।
এটি দুটি ক্লাস্টার একত্রিত করা উচিত কিনা তার আরও পরিশীলিত গণনা সমর্থন করতে প্রক্সিমিটি গ্রাফের ডেটা ব্যবহার করতে পারে। বিশেষ করে দুটি ক্লাস্টার শুধুমাত্র তখনই একত্রিত হয় যখন ফলাফলপ্রাপ্ত ক্লাস্টারের বৈশিষ্ট্য প্রাথমিক দুটি ক্লাস্টারের মতোই থাকে।
এটি প্রক্সিমিটি গ্রাফের স্প্যার্সিফিকেশন নিয়ে আলোচনা করে শুরু করতে পারে, কৌশলের দুটি উদাহরণকে সমর্থন করে যার ক্লাস্টারিং পদ্ধতি এই পদ্ধতির উপর ভিত্তি করে যেমন MST যা একক সংযোগ ক্লাস্টারিং অ্যালগরিদম এবং ওপোসাম।
একটি শ্রেণিবদ্ধ ক্লাস্টারিং অ্যালগরিদম যা ক্লাস্টারগুলিকে একত্রিত করা উচিত কিনা তা নির্ধারণ করতে স্ব-সাম্যের ধারণার প্রয়োজন৷ এটি শেয়ার্ড নেয়ারেস্ট নেবার (SNN) সাদৃশ্যকে সংজ্ঞায়িত করতে পারে, একটি নতুন মিলের পরিমাপ) এবং জার্ভিস-প্যাট্রিক ক্লাস্টারিং অ্যালগরিদম শেখে, যার এই মিল প্রয়োজন৷