ক্যাটাগরিকাল ডেটা হল আলাদা ডেটা। শ্রেণীগত বৈশিষ্ট্যগুলির একটি নির্দিষ্ট সংখ্যক স্বতন্ত্র মান রয়েছে, যার মধ্যে ভৌগলিক এলাকা, কাজের বিভাগ এবং আইটেমের ধরন জড়িত মানগুলির মধ্যে কোন অনুক্রম নেই। শ্রেণীবদ্ধ ডেটার জন্য ধারণা শ্রেণিবিন্যাস তৈরির জন্য বিভিন্ন পদ্ধতি রয়েছে যা নিম্নরূপ -
-
ব্যবহারকারী বা বিশেষজ্ঞদের দ্বারা স্কিমা স্তরে স্পষ্টভাবে বৈশিষ্ট্যগুলির একটি আংশিক ক্রমের স্পেসিফিকেশন − শ্রেণীবদ্ধ বৈশিষ্ট্য বা মাত্রার জন্য ধারণা শ্রেণিবিন্যাস সাধারণত বৈশিষ্ট্যগুলির একটি গ্রুপ ধারণ করে। একজন ব্যবহারকারী বা পেশাদার স্কিমা স্তরে বৈশিষ্ট্যগুলির একটি আংশিক বা সম্পূর্ণ ক্রম সংজ্ঞায়িত করে কেবল একটি ধারণা শ্রেণিবিন্যাসের প্রতিনিধিত্ব করতে পারে।
উদাহরণ স্বরূপ, একটি রিলেশনাল ডাটাবেস বা ডেটা গুদামের একটি ডাইমেনশন এলাকায় রাস্তা, শহর, প্রদেশ বা রাজ্য এবং দেশের মতো বৈশিষ্ট্যগুলির নিম্নলিখিত দল অন্তর্ভুক্ত থাকতে পারে। রাস্তা <শহর <প্রদেশ বা রাজ্য <দেশ
সহ স্কিমা স্তরে এই বৈশিষ্ট্যগুলির মধ্যে মোট ক্রম সংজ্ঞায়িত করে একটি শ্রেণিবিন্যাস উপস্থাপন করা যেতে পারে।-
স্পষ্ট ডেটা গ্রুপিং দ্বারা একটি অনুক্রমের একটি অংশের স্পেসিফিকেশন − এটি একটি ধারণা শ্রেণিবিন্যাসের একটি অংশের ম্যানুয়াল সংজ্ঞা। একটি উচ্চ ডাটাবেসে, সুস্পষ্ট মান গণনার মাধ্যমে একটি সম্পূর্ণ ধারণা শ্রেণিবিন্যাসের প্রতিনিধিত্ব করা অবাস্তব। বিপরীতে, এটি মধ্যবর্তী-স্তরের ডেটার একটি ছোট অংশের জন্য সহজভাবে সুস্পষ্ট গ্রুপিং উপস্থাপন করতে পারে।
-
গুণাবলীর একটি সেটের স্পেসিফিকেশন, কিন্তু তাদের আংশিক ক্রম নয় − একজন ব্যবহারকারী একটি ধারণা শ্রেণিবিন্যাস গঠনকারী বৈশিষ্ট্যগুলির একটি সেট বর্ণনা করতে পারেন, কিন্তু স্পষ্টভাবে তাদের আংশিক ক্রমকে বাদ দিতে পারেন। একটি অর্থপূর্ণ ধারণা শ্রেণিবিন্যাস তৈরি করার জন্য সিস্টেমটি স্বয়ংক্রিয়ভাবে অ্যাট্রিবিউট অর্ডার তৈরি করার চেষ্টা করতে পারে।
এটি এই পর্যবেক্ষণের উপর ভিত্তি করে, প্রদত্ত অ্যাট্রিবিউট সেটে অ্যাট্রিবিউট প্রতি একাধিক স্বতন্ত্র মানের উপর ভিত্তি করে একটি ধারণা অনুক্রম স্বয়ংক্রিয়ভাবে তৈরি করা যেতে পারে। সর্বাধিক স্বতন্ত্র মান সহ বৈশিষ্ট্যটি অনুক্রমের সর্বনিম্ন স্তরে অবস্থিত। একটি অ্যাট্রিবিউটের একাধিক স্বতন্ত্র মান যত কম, জেনারেট করা ধারণা শ্রেণিবিন্যাসে এটি তত বেশি। এই হিউরিস্টিক নিয়ম কিছু ক্ষেত্রে ভাল কাজ করে। কিছু স্থানীয়-স্তরের অদলবদল বা সামঞ্জস্য ব্যবহারকারী বা পেশাদারদের দ্বারা ব্যবহার করা যেতে পারে, যখন প্রয়োজন হয়, উত্পন্ন অনুক্রমের বিশ্লেষণের পরে৷
-
শুধুমাত্র বৈশিষ্ট্যের একটি আংশিক সেটের স্পেসিফিকেশন − অনুক্রমের মধ্যে কী অন্তর্ভুক্ত করা প্রয়োজন সে সম্পর্কে ব্যবহারকারীর একটি অস্পষ্ট ধারণা থাকতে পারে, উদাহরণস্বরূপ, ব্যবহারকারীর নাম শুধুমাত্র প্রথম এবং শেষ নাম উল্লেখ করতে পারে এবং মধ্য নাম অন্তর্ভুক্ত করতে পারে না। এটি যেমন আংশিকভাবে নির্দিষ্ট অনুক্রমটি দ্রুত শব্দার্থিক সংযোগের সাথে বৈশিষ্ট্যগুলিকে একসাথে পিন করার জন্য ডেটাবেস ডিজাইনে ডেটা শব্দার্থবিদ্যা ইনস্টল করার মাধ্যমে পরিচালিত হয়৷