একই বস্তুর শ্রেণীতে ভৌত বা বিমূর্ত বস্তুর সেটকে একত্রিত করার প্রক্রিয়াকে ক্লাস্টারিং বলা হয়। একটি ক্লাস্টার হল ডেটা অবজেক্টের একটি সেট যা একই ক্লাস্টারের মধ্যে একে অপরের মতো এবং অন্যান্য ক্লাস্টারের অবজেক্ট থেকে আলাদা। ডেটা অবজেক্টের একটি ক্লাস্টারকে বিভিন্ন অ্যাপ্লিকেশনে একটি গ্রুপ হিসাবে সম্মিলিতভাবে বিবেচনা করা যেতে পারে। ক্লাস্টার বিশ্লেষণ একটি অপরিহার্য মানব কার্যকলাপ।
ক্লাস্টার বিশ্লেষণ এই রেকর্ডের উপর করা বিভিন্ন ব্যবস্থার উপর নির্ভর করে একই রেকর্ডের গ্রুপ বা ক্লাস্টার গঠন করতে ব্যবহৃত হয়। মূল নকশা হল ক্লাস্টারগুলিকে এমনভাবে সংজ্ঞায়িত করা যা বিশ্লেষণের উদ্দেশ্যের জন্য উপযোগী হতে পারে। এই তথ্যটি জ্যোতির্বিদ্যা, প্রত্নতত্ত্ব, চিকিৎসাবিদ্যা, রসায়ন, শিক্ষা, মনোবিজ্ঞান, ভাষাবিজ্ঞান এবং সমাজবিজ্ঞানের মতো বিভিন্ন ক্ষেত্রে ব্যবহার করা হয়েছে।
বিপণনে ক্লাস্টার বিশ্লেষণের একটি বিখ্যাত ব্যবহার হল বাজার বিভাজনের জন্য - ব্যবহারকারীদের জনসংখ্যা এবং লেনদেনের ইতিহাসের ডেটার উপর ভিত্তি করে বিভক্ত করা হয় এবং প্রতিটি বিভাগের জন্য বিপণন কৌশলগুলি তৈরি করা হয়৷
আরেকটি শব্দ হল বাজারের গঠন বিশ্লেষণের জন্য একই পণ্যের সমতুল্য প্রতিযোগিতামূলক পরিমাপ অনুযায়ী দলগুলিকে চিহ্নিত করা। বিপণন এবং রাজনৈতিক পূর্বাভাসে, ইউএস পোস্টাল জিপ কোড ব্যবহার করে আশেপাশের ক্লাস্টারিং জীবনধারা অনুসারে আশেপাশের এলাকাগুলিকে গোষ্ঠীবদ্ধ করতে দৃঢ়ভাবে ব্যবহার করা হয়েছে৷
ফাইন্যান্সে, ক্লাস্টার বিশ্লেষণ সুষম পোর্টফোলিও তৈরির জন্য ব্যবহার করা যেতে পারে - বিভিন্ন বিনিয়োগের সুযোগের (যেমন, স্টক) উপর তথ্য দেওয়া হলে, কেউ আর্থিক কর্মক্ষমতা ভেরিয়েবলের উপর নির্ভর করে ক্লাস্টার খুঁজে পেতে পারে যার মধ্যে রিটার্ন (দৈনিক, সাপ্তাহিক, বা মাসিক), অস্থিরতা, বিটা এবং শিল্প এবং বাজার মূলধন সহ অন্যান্য বৈশিষ্ট্য। একাধিক ক্লাস্টার থেকে সিকিউরিটি নির্বাচন করা একটি সুষম পোর্টফোলিও তৈরি করতে সাহায্য করতে পারে।
ফাইন্যান্সে ক্লাস্টার বিশ্লেষণের আরেকটি অপারেশন আছে বাজার বিশ্লেষণের জন্য। একটি প্রদত্ত শিল্পের জন্য, এটি বৃদ্ধির হার, লাভজনকতা, শিল্পের আকার, পণ্যের পরিসর এবং বেশ কয়েকটি আন্তর্জাতিক বাজারে উপস্থিতির মতো পরিমাপের উপর ভিত্তি করে একই সংস্থাগুলির দলগুলি খুঁজে পেতে আগ্রহী। তারপরে এই দলগুলিকে বাজারের কাঠামো শিখতে এবং সিদ্ধান্ত নেওয়ার জন্য বিশ্লেষণ করা যেতে পারে, উদাহরণস্বরূপ, কে একজন প্রতিযোগী৷
ক্লাস্টার বিশ্লেষণ বিপুল পরিমাণ ডেটার জন্য ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, ইন্টারনেট অনুসন্ধান ইঞ্জিনগুলি ব্যবহারকারীদের জমা দেওয়া প্রশ্নগুলিকে ক্লাস্টার করার জন্য ক্লাস্টারিং পদ্ধতি ব্যবহার করে। এগুলি তারপরে অনুসন্ধান অ্যালগরিদম বিকাশের জন্য ব্যবহার করা যেতে পারে৷
সাধারণত, ক্লাস্টার করার জন্য ব্যবহৃত মৌলিক ডেটা হল বিভিন্ন ভেরিয়েবলের পরিমাপের একটি টেবিল, যেখানে প্রতিটি কলাম একটি পরিবর্তনশীলকে সংজ্ঞায়িত করে এবং একটি সারি একটি রেকর্ডকে সংজ্ঞায়িত করে। উদ্দেশ্য হল ডেটার গ্রুপ গঠন করা যাতে একই রেকর্ড একই গ্রুপে থাকে। ক্লাস্টারের সংখ্যা পূর্ব-নির্দিষ্ট বা ডেটা থেকে সিদ্ধান্ত নেওয়া যেতে পারে।