কম্পিউটার

আউটলাইয়ার সনাক্তকরণের পদ্ধতিগুলি কী কী?


আউটলিয়ার সনাক্তকরণের বিভিন্ন পদ্ধতি রয়েছে যা নিম্নরূপ -

তত্ত্বাবধান করা পদ্ধতি - তত্ত্বাবধানে পদ্ধতি মডেল ডেটা স্বাভাবিকতা এবং অস্বাভাবিকতা। ডোমেন পেশাদাররা প্রাথমিক ডেটার একটি নমুনা পরীক্ষা করে এবং লেবেল করে। বহিরাগত সনাক্তকরণ একটি শ্রেণিবিন্যাস সমস্যা হিসাবে মডেল করা যেতে পারে। পরিষেবাটি হল একটি শ্রেণিবদ্ধকারীকে বোঝা যা বহিরাগতদের সনাক্ত করতে পারে।

নমুনা প্রশিক্ষণ এবং পরীক্ষার জন্য ব্যবহার করা যেতে পারে। বিভিন্ন অ্যাপ্লিকেশানে, পেশাদাররা শুধুমাত্র সাধারণ বস্তুর লেবেল দিতে পারেন, এবং সাধারণ বস্তুর মডেলের সাথে সংযোগ না করে এমন কিছু বস্তুকে বহিরাগত হিসাবে নথিভুক্ত করা হয়। বিভিন্ন পদ্ধতিতে আউটলিয়ারদের মডেল করা হয় এবং আউটলারের মডেলের সাথে সংযোগ না করে এমন বস্তুকে স্বাভাবিক হিসাবে বিবেচনা করা হয়।

নিরীক্ষণের পদ্ধতি − বিভিন্ন প্রয়োগ পদ্ধতিতে, "স্বাভাবিক" বা "বহিরাগত" হিসাবে লেবেল করা বস্তুগুলি প্রযোজ্য নয়৷ অতএব, একটি তত্ত্বাবধানহীন শেখার পদ্ধতি ব্যবহার করতে হবে। তত্ত্বাবধানহীন আউটলায়ার সনাক্তকরণ পদ্ধতি একটি অন্তর্নিহিত অনুমান তৈরি করে যেমন সাধারণ বস্তুগুলি যথেষ্ট "গুচ্ছ"।

একটি তত্ত্বাবধানহীন আউটলায়ার সনাক্তকরণ পদ্ধতি ভবিষ্যদ্বাণী করে যে সাধারণ বস্তুগুলি আউটলারের তুলনায় অনেক বেশি সাধারণভাবে একটি প্যাটার্ন অনুসরণ করে। সাধারণ বস্তুগুলিকে বড় মিল ভাগ করে নেওয়া একটি দলে প্রত্যাখ্যান করতে হবে না। পরিবর্তে, তারা বেশ কয়েকটি গ্রুপ গঠন করতে পারে, যেখানে প্রতিটি গ্রুপের একাধিক বৈশিষ্ট্য রয়েছে।

এই অনুমান কখনও সত্য হতে পারে না. স্বাভাবিক বস্তু কিছু শক্তিশালী নিদর্শন পাঠায় না. বরং, তারা অভিন্নভাবে বিতরণ করা হয়. সমষ্টিগত বহিরাগত, একটি ছোট এলাকায় বড় মিল ভাগ করে নেয়।

তত্ত্বাবধানহীন পদ্ধতিগুলি এই ধরনের বহিরাগতদের দক্ষতার সাথে সনাক্ত করতে পারে না। কিছু অ্যাপ্লিকেশনে, স্বাভাবিক বস্তু আলাদাভাবে বিতরণ করা হয়, এবং বেশ কিছু বস্তু শক্তিশালী নিদর্শন অনুসরণ করে না। উদাহরণস্বরূপ, কিছু অনুপ্রবেশ সনাক্তকরণ এবং কম্পিউটার ভাইরাস সনাক্তকরণের ক্ষেত্রে, স্বাভাবিক ক্রিয়াকলাপগুলি স্বতন্ত্র এবং কিছু উচ্চ-মানের ক্লাস্টারে হ্রাস পায় না।

কিছু ক্লাস্টারিং পদ্ধতিগুলিকে তত্ত্বাবধানহীন আউটলায়ার সনাক্তকরণ পদ্ধতি হিসাবে সুবিধার জন্য অভিযোজিত করা যেতে পারে। মূল ধারণাটি হল প্রথমে ক্লাস্টারগুলি আবিষ্কার করা, এবং সেইজন্য কিছু ক্লাস্টারের অন্তর্গত নয় এমন ডেটা অবজেক্টগুলি আউটলায়ার হিসাবে চিহ্নিত করা হয়। যাইহোক, এই ধরনের পদ্ধতি দুটি বিষয় থেকে খারাপ হয়. প্রথমত, কিছু ক্লাস্টারের অন্তর্গত নয় এমন একটি ডেটা অবজেক্ট আউটলাইয়ারের পরিবর্তে শব্দ হতে পারে। দ্বিতীয়ত, প্রথমে ক্লাস্টারগুলি আবিষ্কার করা এবং তারপর বহিরাগতদের আবিষ্কার করা ব্যয়বহুল৷

আধা-তত্ত্বাবধান পদ্ধতি − বেশ কয়েকটি অ্যাপ্লিকেশনে, যদিও কিছু লেবেলযুক্ত দৃষ্টান্ত পাওয়া সম্ভব, এই ধরনের লেবেলযুক্ত দৃষ্টান্তের সংখ্যা কম। এটি এমন ক্ষেত্রে সম্মুখীন হতে পারে যেখানে সাধারণ এবং বহিরাগত বস্তুর একটি ছোট গ্রুপ লেবেল করা হয়, কিন্তু কিছু ডেটা লেবেলবিহীন থাকে। আধা-তত্ত্বাবধানে আউটলিয়ার সনাক্তকরণ পদ্ধতিগুলি এই জাতীয় পদ্ধতিগুলি মোকাবেলা করার জন্য তৈরি করা হয়েছিল৷

আধা-তত্ত্বাবধানে আউটলিয়ার সনাক্তকরণ পদ্ধতিগুলি আধা-তত্ত্বাবধানে শেখার পদ্ধতির প্রয়োগ হিসাবে উদ্বিগ্ন হতে পারে। উদাহরণস্বরূপ, যখন কিছু লেবেলযুক্ত সাধারণ বস্তু অ্যাক্সেসযোগ্য হয়, তখন এটি সাধারণ বস্তুর জন্য একটি মডেল প্রশিক্ষণের জন্য কাছাকাছি থাকা লেবেলবিহীন বস্তুগুলির সাথে ব্যবহার করতে পারে। সাধারণ বস্তুর মডেল বহির্মুখীকে চিহ্নিত করতে ব্যবহৃত হয়—যেসব বস্তু সাধারণ বস্তুর মডেলের জন্য উপযুক্ত নয় সেগুলিকে বহিরাগত হিসেবে সংজ্ঞায়িত করা হয়।


  1. তথ্য সুরক্ষায় প্রমাণীকরণ পদ্ধতিগুলি কী কী?

  2. মাল্টি-ফ্যাক্টর অনুমোদনের পদ্ধতিগুলি কী কী?

  3. অডিও স্টেগানোগ্রাফি পদ্ধতি কি কি?

  4. ইনফরমেশন সিকিউরিটিতে ইমেজ স্টেগানোগ্রাফির পদ্ধতিগুলো কী কী?