কম্পিউটার

শ্রেণীগত ডেটার জন্য ডিসক্রেটাইজেশন এবং কনসেপ্ট হায়ারার্কি জেনারেশনের কৌশলগুলি কী?


ক্যাটাগরিকাল ডেটা হল আলাদা ডেটা। শ্রেণীগত বৈশিষ্ট্যগুলির একটি নির্দিষ্ট সংখ্যক স্বতন্ত্র মান রয়েছে, যার মধ্যে ভৌগলিক এলাকা, কাজের বিভাগ এবং আইটেমের ধরন জড়িত মানগুলির মধ্যে কোন অনুক্রম নেই। শ্রেণীবদ্ধ ডেটার জন্য ধারণা শ্রেণিবিন্যাস তৈরির জন্য বিভিন্ন পদ্ধতি রয়েছে যা নিম্নরূপ -

  • ব্যবহারকারী বা বিশেষজ্ঞদের দ্বারা স্কিমা স্তরে স্পষ্টভাবে বৈশিষ্ট্যগুলির একটি আংশিক ক্রমের স্পেসিফিকেশন − শ্রেণীবদ্ধ বৈশিষ্ট্য বা মাত্রার জন্য ধারণা শ্রেণিবিন্যাস সাধারণত বৈশিষ্ট্যগুলির একটি গ্রুপ ধারণ করে। একজন ব্যবহারকারী বা পেশাদার স্কিমা স্তরে বৈশিষ্ট্যগুলির একটি আংশিক বা সম্পূর্ণ ক্রম সংজ্ঞায়িত করে কেবল একটি ধারণা শ্রেণিবিন্যাসের প্রতিনিধিত্ব করতে পারে।

উদাহরণ স্বরূপ, একটি রিলেশনাল ডাটাবেস বা ডেটা গুদামের একটি ডাইমেনশন এলাকায় রাস্তা, শহর, প্রদেশ বা রাজ্য এবং দেশের মতো বৈশিষ্ট্যগুলির নিম্নলিখিত দল অন্তর্ভুক্ত থাকতে পারে। রাস্তা <শহর <প্রদেশ বা রাজ্য <দেশ

সহ স্কিমা স্তরে এই বৈশিষ্ট্যগুলির মধ্যে মোট ক্রম সংজ্ঞায়িত করে একটি শ্রেণিবিন্যাস উপস্থাপন করা যেতে পারে।
  • স্পষ্ট ডেটা গ্রুপিং দ্বারা একটি অনুক্রমের একটি অংশের স্পেসিফিকেশন − এটি একটি ধারণা শ্রেণিবিন্যাসের একটি অংশের ম্যানুয়াল সংজ্ঞা। একটি উচ্চ ডাটাবেসে, সুস্পষ্ট মান গণনার মাধ্যমে একটি সম্পূর্ণ ধারণা শ্রেণিবিন্যাসের প্রতিনিধিত্ব করা অবাস্তব। বিপরীতে, এটি মধ্যবর্তী-স্তরের ডেটার একটি ছোট অংশের জন্য সহজভাবে সুস্পষ্ট গ্রুপিং উপস্থাপন করতে পারে।

  • গুণাবলীর একটি সেটের স্পেসিফিকেশন, কিন্তু তাদের আংশিক ক্রম নয় − একজন ব্যবহারকারী একটি ধারণা শ্রেণিবিন্যাস গঠনকারী বৈশিষ্ট্যগুলির একটি সেট বর্ণনা করতে পারেন, কিন্তু স্পষ্টভাবে তাদের আংশিক ক্রমকে বাদ দিতে পারেন। একটি অর্থপূর্ণ ধারণা শ্রেণিবিন্যাস তৈরি করার জন্য সিস্টেমটি স্বয়ংক্রিয়ভাবে অ্যাট্রিবিউট অর্ডার তৈরি করার চেষ্টা করতে পারে।

এটি এই পর্যবেক্ষণের উপর ভিত্তি করে, প্রদত্ত অ্যাট্রিবিউট সেটে অ্যাট্রিবিউট প্রতি একাধিক স্বতন্ত্র মানের উপর ভিত্তি করে একটি ধারণা অনুক্রম স্বয়ংক্রিয়ভাবে তৈরি করা যেতে পারে। সর্বাধিক স্বতন্ত্র মান সহ বৈশিষ্ট্যটি অনুক্রমের সর্বনিম্ন স্তরে অবস্থিত। একটি অ্যাট্রিবিউটের একাধিক স্বতন্ত্র মান যত কম, জেনারেট করা ধারণা শ্রেণিবিন্যাসে এটি তত বেশি। এই হিউরিস্টিক নিয়ম কিছু ক্ষেত্রে ভাল কাজ করে। কিছু স্থানীয়-স্তরের অদলবদল বা সামঞ্জস্য ব্যবহারকারী বা পেশাদারদের দ্বারা ব্যবহার করা যেতে পারে, যখন প্রয়োজন হয়, উত্পন্ন অনুক্রমের বিশ্লেষণের পরে৷

  • শুধুমাত্র বৈশিষ্ট্যের একটি আংশিক সেটের স্পেসিফিকেশন − অনুক্রমের মধ্যে কী অন্তর্ভুক্ত করা প্রয়োজন সে সম্পর্কে ব্যবহারকারীর একটি অস্পষ্ট ধারণা থাকতে পারে, উদাহরণস্বরূপ, ব্যবহারকারীর নাম শুধুমাত্র প্রথম এবং শেষ নাম উল্লেখ করতে পারে এবং মধ্য নাম অন্তর্ভুক্ত করতে পারে না। এটি যেমন আংশিকভাবে নির্দিষ্ট অনুক্রমটি দ্রুত শব্দার্থিক সংযোগের সাথে বৈশিষ্ট্যগুলিকে একসাথে পিন করার জন্য ডেটাবেস ডিজাইনে ডেটা শব্দার্থবিদ্যা ইনস্টল করার মাধ্যমে পরিচালিত হয়৷


  1. অনুপ্রবেশ সনাক্তকরণ এবং প্রতিরোধের জন্য ডেটা মাইনিংয়ের পদ্ধতিগুলি কী কী?

  2. বিজ্ঞান এবং প্রকৌশলে ডেটা মাইনিংয়ের ভূমিকা কী?

  3. ডেটা সুরক্ষা এবং ডেটা অখণ্ডতার মধ্যে পার্থক্য কী?

  4. স্টেগানালিসিস এর কৌশল কি কি?