কম্পিউটার

ডেটা মাইনিংয়ে ক্লাস্টারিংয়ের ধরন কী কী?


বিভিন্ন ধরণের ক্লাস্টারিং রয়েছে যা নিম্নরূপ -

অনুক্রমিক বনাম পার্টিশনাল − বিভিন্ন ধরণের ক্লাস্টারিংয়ের মধ্যে উপলব্ধি হল ক্লাস্টারগুলির সেটটি নেস্টেড বা আননেস্টেড, বা জনপ্রিয় পরিভাষায়, শ্রেণিবদ্ধ বা বিভাজনীয়। একটি পার্টিশনাল ক্লাস্টারিং হল ডেটা অবজেক্টের গোষ্ঠীকে অ-ওভারল্যাপিং সাবসেটে (ক্লাস্টার) বন্টন করা যার মধ্যে প্রতিটি ডেটা অবজেক্ট সত্যই একটি সাবসেটে রয়েছে।

এটি ক্লাস্টারগুলিতে সাবক্লাস্টার থাকার অনুমতি দিতে পারে, তাই এটিকে শ্রেণিবদ্ধ ক্লাস্টারিং প্রয়োজন, যা একটি বৃক্ষ হিসাবে বরাদ্দ করা নেস্টেড ক্লাস্টারগুলির একটি গ্রুপ। গাছের প্রতিটি নোড (গুচ্ছ) (লিফ নোড ব্যতীত) হল তার সন্তানদের (সাবক্লাস্টার) মিলন, এবং গাছের মূল হল সমস্ত বস্তু সহ ক্লাস্টার।

এক্সক্লুসিভ বনাম ওভারল্যাপিং বনাম ফিজি - ক্লাস্টারিং সবই একচেটিয়া, কারণ তারা প্রতিটি বস্তুকে একটি পৃথক ক্লাস্টারে তৈরি করে। এমন অনেকগুলি অবস্থান রয়েছে যেখানে একটি বিন্দু একটি ক্লাস্টারের চেয়ে বেশি স্থানে অবস্থিত হতে পারে এবং এই পরিস্থিতিগুলি অ-এক্সক্লুসিভ ক্লাস্টারিং দ্বারা উচ্চতর সমাধান করা হয়৷

এই পদ্ধতিতে, একটি ওভারল্যাপিং বা নন-এক্সক্লুসিভ ক্লাস্টারিং এই সত্যটি অনুসরণ করতে পারে যে একটি বস্তু একাধিক গ্রুপের (শ্রেণীর) অন্তর্গত হতে পারে। উদাহরণস্বরূপ, একটি বিশ্ববিদ্যালয়ের একজন ব্যক্তি নথিভুক্ত প্রার্থী এবং বিশ্ববিদ্যালয়ের একজন কর্মচারী উভয়ই হতে পারেন।

একটি অস্বস্তিকর ক্লাস্টারিং-এ, প্রতিটি বস্তু প্রতিটি ক্লাস্টারে প্রযোজ্য হয় সদস্যতার ওজন সহ যা 0 (স্পষ্টভাবে প্রযোজ্য নয়) এবং 1 (স্পষ্টভাবে প্রযোজ্য) এর মধ্যে থাকে। অন্য পদে, ক্লাস্টারগুলিকে ফিজি সেট হিসাবে বিবেচনা করা হয়।

সম্পূর্ণ বনাম আংশিক - একটি সম্পূর্ণ ক্লাস্টারিং প্রতিটি বস্তুকে একটি ক্লাস্টারে তৈরি করে, যেখানে একটি আংশিক ক্লাস্টারিং করে না। আংশিক ক্লাস্টারিংয়ের কারণ হল যে একটি ডেটা সেটের কিছু বস্তু পরিষ্কার গ্রুপের অন্তর্গত হতে পারে না। ডেটা সেটে থাকা বস্তুগুলি বেশ কয়েকবার শব্দ, আউটলিয়ার বা "অরুচিহীন ব্যাকগ্রাউন্ড" সংজ্ঞায়িত করতে পারে। উদাহরণস্বরূপ, কিছু সংবাদপত্রের গল্পগুলি গ্লোবাল ওয়ার্মিং সহ একটি সাধারণ নকশা ভাগ করতে পারে, যখন বিভিন্ন গল্পগুলি আরও সার্বজনীন বা এক ধরণের হয়৷

অতএব, এটি গত মাসের গল্পগুলির গুরুত্বপূর্ণ বিষয়গুলি আবিষ্কার করতে পারে, এটি কেবলমাত্র একটি সাধারণ থিম দ্বারা খুব কমই সংযুক্ত নথিগুলির ক্লাস্টারগুলির জন্য অনুসন্ধান করা প্রয়োজন৷ কিছু ক্ষেত্রে, বস্তুর একটি সম্পূর্ণ ক্লাস্টারিং অর্জিত হয়। উদাহরণস্বরূপ, ব্রাউজিংয়ের জন্য ফাইলগুলিকে সংগঠিত করার জন্য একটি অ্যাপ্লিকেশনের জন্য ক্লাস্টারিংয়ের প্রয়োজন হয় যাতে সমস্ত ফাইল ব্রাউজ করা যায় তার গ্যারান্টি প্রয়োজন৷


  1. ডেটা মাইনিং ইন্টারফেস কি?

  2. মাইনিং সিকোয়েন্স ডেটার প্রকারগুলি কী কী?

  3. ডেটা মাইনিংয়ে আউটলায়ারের ধরন কী কী?

  4. ডেটা ইন্টিগ্রিটি কত প্রকার?