কম্পিউটার

নামমাত্র ডেটার জন্য ধারণা শ্রেণিবিন্যাস তৈরির পদ্ধতিগুলি কী কী?


নিম্নরূপ নামমাত্র ডেটার জন্য ধারণা শ্রেণিবিন্যাস তৈরির জন্য বিভিন্ন পদ্ধতি রয়েছে -

ব্যবহারকারী বা পেশাদারদের দ্বারা স্কিমা স্তরে স্পষ্টভাবে বৈশিষ্ট্যগুলির একটি আংশিক ক্রম নির্দিষ্টকরণ − নামমাত্র বৈশিষ্ট্য বা মাত্রার জন্য ধারণা শ্রেণিবিন্যাস সাধারণত বৈশিষ্ট্যগুলির একটি সেট ধারণ করে। একজন ব্যবহারকারী বা পেশাদাররা স্কিমা স্তরে বৈশিষ্ট্যগুলির একটি আংশিক বা সম্পূর্ণ নিয়ন্ত্রণ সংজ্ঞায়িত করে কেবল একটি ধারণা শ্রেণিবিন্যাসকে উপস্থাপন করতে পারেন।

উদাহরণস্বরূপ, ধরুন যে একটি রিলেশনাল ডাটাবেসে নিম্নলিখিত বৈশিষ্ট্যগুলির সেট অন্তর্ভুক্ত রয়েছে যেমন রাস্তা, শহর, প্রদেশ বা রাজ্য এবং দেশ। একটি ডেটা গুদামের অবস্থানের মাত্রা একই বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করতে পারে। রাস্তা <শহর <প্রদেশ বা রাজ্য <দেশ

সহ স্কিমা স্তরে এই বৈশিষ্ট্যগুলির মধ্যে মোট ক্রম বর্ণনা করে একটি শ্রেণিবিন্যাস উপস্থাপন করা যেতে পারে।

স্পষ্ট ডেটা গ্রুপিং দ্বারা একটি অনুক্রমের একটি অংশের স্পেসিফিকেশন − এটি মূলত একটি ধারণা অনুক্রমের একটি অংশের ম্যানুয়াল বর্ণনা। একটি বিশাল ডাটাবেসে, সুস্পষ্ট মান গণনার মাধ্যমে একটি সম্পূর্ণ ধারণা শ্রেণিবিন্যাস বর্ণনা করা অবাস্তব।

গুণাবলীর একটি সেটের স্পেসিফিকেশন, কিন্তু তাদের আংশিক ক্রম নয় − একজন ব্যবহারকারী একটি ধারণা শ্রেণিবিন্যাস গঠন করে বৈশিষ্ট্যগুলির একটি সেট সংজ্ঞায়িত করতে পারেন, তবে তাদের আংশিক ক্রম স্পষ্টভাবে উল্লেখ করার জন্য বাদ দিতে পারেন। সিস্টেমটি স্বয়ংক্রিয়ভাবে অ্যাট্রিবিউটের ক্রম তৈরি করার চেষ্টা করতে পারে যাতে একটি উল্লেখযোগ্য ধারণা অনুক্রম তৈরি করা যায়।

পর্যবেক্ষণটি বিবেচনা করুন যে যেহেতু উচ্চ-স্তরের ধারণাগুলি সাধারণত একাধিক অধস্তন নিম্ন-স্তরের ধারণাগুলিকে কভার করে, একটি উচ্চ ধারণার স্তর (যেমন, দেশ) বর্ণনা করে এমন একটি বৈশিষ্ট্য সাধারণত একটি নিম্ন ধারণা স্তরকে বর্ণনা করে এমন একটি বৈশিষ্ট্যের তুলনায় স্বতন্ত্র মানগুলির একটি ছোট সংখ্যা অন্তর্ভুক্ত করবে (যেমন, রাস্তা)।

এটি এই পর্যবেক্ষণের উপর নির্ভর করে, প্রদত্ত অ্যাট্রিবিউট সেটে প্রতি বৈশিষ্ট্যের একাধিক স্বতন্ত্র মানের উপর ভিত্তি করে একটি ধারণা শ্রেণিবিন্যাস স্বয়ংক্রিয়ভাবে তৈরি করা যেতে পারে। সর্বাধিক স্বতন্ত্র মান সহ বৈশিষ্ট্যটি সর্বনিম্ন শ্রেণিবিন্যাস স্তরে অবস্থিত৷

একটি অ্যাট্রিবিউটের একাধিক স্বতন্ত্র মান যত কম হবে, জেনারেট করা ধারণা অনুক্রমের মধ্যে এটি তত বড় হবে। এই হিউরিস্টিক নিয়মটি বেশ কয়েকটি ক্ষেত্রে ভালভাবে কাজ করে। কিছু স্থানীয়-স্তরের অদলবদল বা অভিযোজন ব্যবহারকারী বা বিশেষজ্ঞদের দ্বারা ব্যবহার করা যেতে পারে, যখন প্রয়োজনীয়, উত্পন্ন অনুক্রমের বিশ্লেষণের পরে৷

শুধুমাত্র বৈশিষ্ট্যের একটি আংশিক সেটের স্পেসিফিকেশন − কখনও কখনও একজন ব্যবহারকারী অনুক্রমের বর্ণনা দেওয়ার সময় ভুল হতে পারে, অথবা অনুক্রমের মধ্যে কী থাকতে হবে সে সম্পর্কে শুধুমাত্র একটি অস্পষ্ট ধারণা থাকতে পারে। ফলস্বরূপ, ব্যবহারকারী অনুক্রমের বিবরণে প্রাসঙ্গিক বৈশিষ্ট্যগুলির শুধুমাত্র একটি ছোট উপসেট অন্তর্ভুক্ত করতে পারেন৷

এটি এই ধরনের আংশিকভাবে নির্দিষ্ট শ্রেণীবিন্যাস পরিচালনা করতে পারে, ডাটাবেস ডিজাইনে তথ্য শব্দার্থবিদ্যা এম্বেড করা অপরিহার্য যাতে দ্রুত শব্দার্থিক লিঙ্কগুলির সাথে বৈশিষ্ট্যগুলি একসাথে পিন করা যায়। এই পদ্ধতিতে, একটি বৈশিষ্ট্যের উপস্থাপনা একটি সম্পূর্ণ শ্রেণিবিন্যাস ডিজাইন করার জন্য শব্দার্থগতভাবে শক্তভাবে সংযুক্ত বৈশিষ্ট্যগুলির একটি সম্পূর্ণ গ্রুপকে "টেনে আনতে" ট্রিগার করতে পারে। প্রয়োজনীয় হিসাবে ব্যবহারকারীদের এই বৈশিষ্ট্যটি বিপরীত করার বিকল্প থাকা উচিত।


  1. সীমাবদ্ধতার সাথে ক্লাস্টার করার পদ্ধতিগুলি কী কী?

  2. গোপনীয়তা-সংরক্ষণের ডেটা মাইনিংয়ের পদ্ধতিগুলি কী কী?

  3. সুপারিশকারী সিস্টেমের জন্য ডেটা মাইনিং পদ্ধতিগুলি কী কী?

  4. অনুপ্রবেশ সনাক্তকরণ এবং প্রতিরোধের জন্য ডেটা মাইনিংয়ের পদ্ধতিগুলি কী কী?