কম্পিউটার

অ্যাসোসিয়েশন রুল ক্লাস্টারিং সিস্টেমের সাথে জড়িত পদক্ষেপগুলি কী কী?


অ্যাসোসিয়েশন রুল ক্লাস্টারিং সিস্টেমে নিম্নলিখিত পদক্ষেপগুলি জড়িত যা নিম্নরূপ -

বিনিং − পরিমাণগত বৈশিষ্ট্যে তাদের ডোমেনের প্রতিনিধিত্বকারী মানগুলির বিস্তৃত পরিসর থাকতে পারে। এটি 2-ডি গ্রিড কত বড় হবে তা নিয়ে ভাবতে পারে যদি এটি বয়স এবং আয়কে অক্ষ হিসাবে প্লট করতে পারে, যেখানে বয়সের প্রতিটি সম্ভাব্য মান একটি অক্ষের উপর একটি নির্দিষ্ট অবস্থান তৈরি করা হয়েছিল এবং একইভাবে, আয়ের প্রতিটি সম্ভাব্য মান একটি নির্দিষ্ট তৈরি করা হয়েছিল। অন্য অক্ষে অবস্থান।

এটি একটি পরিচালনাযোগ্য আকারে গ্রিডগুলি বজায় রাখতে পারে, এটি পরিবর্তে পরিমাণগত বৈশিষ্ট্যগুলির ক্ষেত্রগুলিকে বিরতিতে ভাগ করতে পারে। এই ব্যবধানগুলি শক্তিশালী যে তারা খনির পর্যায়ে একত্রিত হতে পারে। বিভাজন পর্যায়টিকে বিনিং হিসাবে সংজ্ঞায়িত করা হয়, অর্থাৎ, যেখানে বিরতিগুলিকে "বিন" হিসাবে গণ্য করা হয়৷

নিম্নরূপ তিনটি সাধারণ বিনিং কৌশল ক্ষেত্র রয়েছে -

সমান-প্রস্থ বিনিং৷ − সমান-প্রস্থ বাইনিংয়ে, যেখানে প্রতিটি বিনের ব্যবধানের আকার একই।

সমান-ফ্রিকোয়েন্সি বাইনিং − সমান ফ্রিকোয়েন্সি বাইনিংয়ে, যেখানে প্রতিটি বিনের প্রায় একই সংখ্যক টিপল বরাদ্দ করা আছে।

ক্লাস্টারিং-ভিত্তিক বিনিং − ক্লাস্টারিং-ভিত্তিক বিনিং-এ, যেখানে ক্লাস্টারিং একই বিনের মধ্যে গোষ্ঠীগত প্রতিবেশী পয়েন্টের (বিভিন্ন দূরত্বের পরিমাপের ভিত্তিতে বিচার করা হয়) পরিমাণগত বৈশিষ্ট্যের উপর সঞ্চালিত হয়।

ARCS-এর সমান-প্রস্থ বিনিং প্রয়োজন, যেখানে প্রতিটি পরিমাণগত বৈশিষ্ট্যের জন্য বিনের আকার ব্যবহারকারীর দ্বারা ইনপুট হয়। উভয় পরিমাণগত বৈশিষ্ট্য সহ প্রতিটি সম্ভাব্য বিন সমন্বয়ের জন্য একটি 2-ডি অ্যারে তৈরি করা হয়৷

প্রতিটি অ্যারে সেল নিয়মের ডানদিকের শ্রেণীগত বৈশিষ্ট্যের প্রতিটি অর্জনযোগ্য শ্রেণীর জন্য সংশ্লিষ্ট গণনা বিতরণকে প্রভাবিত করে। এই ডেটা স্ট্রাকচার তৈরি করে, টাস্ক-প্রাসঙ্গিক ডেটা শুধুমাত্র একবার স্ক্যান করতে হবে। একই 2-ডি অ্যারে ব্যবহার করা যেতে পারে শ্রেণীবদ্ধ বৈশিষ্ট্যের কিছু মানের জন্য নিয়ম তৈরি করতে, একই দুটি পরিমাণগত বৈশিষ্ট্যের উপর নির্ভর করে।

ঘন ঘন প্রেডিকেট সেট খোঁজা − কারণ প্রতিটি বিভাগের জন্য গণনা বন্টন সহ 2-ডি অ্যারে সেট আপ করা হয়েছে, এটি স্ক্যান করা যেতে পারে ঘন ঘন প্রেডিকেট সেটগুলি আবিষ্কার করতে (যেগুলি সন্তুষ্ট ন্যূনতম সমর্থন) যা ন্যূনতম আত্মবিশ্বাসকেও সন্তুষ্ট করে৷

অ্যালগরিদম নিয়মের আয়তক্ষেত্রাকার ক্লাস্টারের জন্য গ্রিড পরীক্ষা করে। এই পদ্ধতিতে, একটি নিয়ম ক্লাস্টারের মধ্যে উপস্থিত পরিমাণগত বৈশিষ্ট্যগুলির বিনগুলিকে একত্রিত করা যেতে পারে, এবং তাই পরিমাণগত বৈশিষ্ট্যগুলির গতিশীল বিচক্ষণতা প্রদর্শিত হয়৷

গ্রিড-ভিত্তিক পদ্ধতি বর্ণনা করেছে যে মূল অ্যাসোসিয়েশন নিয়মগুলি আয়তক্ষেত্রাকার অঞ্চলে ক্লাস্টার করা যেতে পারে। ক্লাস্টারিং বাস্তবায়ন করার আগে, রেকর্ড থেকে শব্দ এবং বহিরাগত অপসারণ প্রদান করতে মসৃণ পদ্ধতি ব্যবহার করা যেতে পারে। আয়তক্ষেত্রাকার ক্লাস্টার তথ্যকে অতি সরলীকরণ করতে পারে।

একটি নন-গ্রিড-ভিত্তিক পদ্ধতির সুপারিশ করা হয়েছে পরিমাণগত অ্যাসোসিয়েশন নিয়মগুলি আবিষ্কার করার জন্য যা আরও সাধারণ, যেখানে নিয়মের উভয় পাশে বেশ কয়েকটি পরিমাণগত এবং শ্রেণীবদ্ধ বৈশিষ্ট্যগুলি ঘটতে পারে৷

এই পদ্ধতিতে, পরিমাণগত বৈশিষ্ট্যগুলি একই ফ্রিকোয়েন্সি বিনিং ব্যবহার করে গতিশীলভাবে বিচ্ছিন্ন করা হয়, এবং পার্টিশনগুলিকে একত্রিত করা হয় আংশিক সম্পূর্ণতার পরিমাপের উপর নির্ভর করে, যা পার্টিশনের কারণে হারিয়ে যাওয়া ডেটার পরিমাণ নির্ধারণ করে।


  1. বায়োমেট্রিক প্রমাণীকরণ সিস্টেমে ব্যবহৃত পদক্ষেপগুলি কী কী?

  2. তথ্য সুরক্ষায় RSA-এর পদক্ষেপগুলি কী কী?

  3. একটি জাভা প্রোগ্রাম চালানোর জন্য জড়িত বিভিন্ন পদক্ষেপ কি কি?

  4. OS এ কার্নেল কি? কার্নেল কত প্রকার?