কম্পিউটার

ডেটা মাইনিংয়ে আউটলায়ারের ধরন কী কী?


ডেটা মাইনিং-এ বিভিন্ন ধরনের আউটলায়ার রয়েছে যা নিম্নরূপ -

গ্লোবাল আউটলায়ার্স − একটি প্রদত্ত ডেটা সেটে, একটি ডেটা অবজেক্ট একটি বৈশ্বিক আউটলায়ার যদি এটি বাকি তথ্য সেট থেকে মূলত বিচ্যুত হয়। গ্লোবাল আউটলায়ার্সকে পয়েন্ট অ্যানোমালিস বলা হয় এবং তারা সবচেয়ে সহজ ধরনের আউটলায়ার। বেশিরভাগ আউটলায়ার সনাক্তকরণ পদ্ধতির লক্ষ্য বিশ্বব্যাপী বহিরাগতদের আবিষ্কার করা।

এটি বিশ্বব্যাপী বহিরাগতদের সনাক্ত করতে পারে, একটি গুরুত্বপূর্ণ সমস্যা হল প্রশ্নে থাকা অ্যাপ্লিকেশন সম্পর্কিত বিচ্যুতির একটি উপযুক্ত পরিমাপ আবিষ্কার করা। এখানে বেশ কিছু পরিমাপ প্রস্তাব করা হয়েছে, এবং এগুলোর উপর নির্ভর করে, বহিরাগত সনাক্তকরণ পদ্ধতিগুলিকে একাধিক বিভাগে বিভক্ত করা হয়েছে।

বিভিন্ন অ্যাপ্লিকেশনে গ্লোবাল আউটলায়ার সনাক্তকরণ অপরিহার্য। কম্পিউটার নেটওয়ার্কে অনুপ্রবেশ সনাক্তকরণ বিবেচনা করুন, উদাহরণস্বরূপ, যদি একটি কম্পিউটারের যোগাযোগের আচরণ স্বাভাবিক ডিজাইন থেকে ভিন্ন হয় (যেমন, অল্প সময়ের মধ্যে বিপুল সংখ্যক প্যাকেজের বিজ্ঞাপন দেওয়া হয়), এই আচরণটিকে একটি বিশ্বব্যাপী আউটলায়ার হিসাবে বিবেচনা করা যেতে পারে এবং সংশ্লিষ্ট কম্পিউটার হ্যাকিংয়ের একটি সন্দেহভাজন দুর্ঘটনা।

প্রসঙ্গিক বহিরাগত − প্রাসঙ্গিক বহিঃপ্রকাশককে শর্তসাপেক্ষ আউটলায়ার বলা হয়। প্রদত্ত ডেটা সেটের কিছু নির্দিষ্ট অবস্থার কারণে যদি একটি ডেটা অবজেক্ট একাধিক ডেটা পয়েন্ট থেকে বিচ্যুত হয় তবে এই ধরনের আউটলায়ারগুলি উপস্থিত হয়৷

প্রাসঙ্গিক বৈশিষ্ট্য এবং আচরণগত বৈশিষ্ট্য সহ ডেটা অবজেক্টের দুটি ধরণের বৈশিষ্ট্য রয়েছে। প্রাসঙ্গিক বহিঃপ্রকাশ বিশ্লেষণ ব্যবহারকারীদের একাধিক প্রসঙ্গ এবং শর্তে বহিরাগত নির্ধারণ করতে দেয়, যা বিভিন্ন অ্যাপ্লিকেশনে উপকারী হতে পারে।

আচরণগত বৈশিষ্ট্যগুলিতে, এটি বস্তুর বৈশিষ্ট্যগুলিকে প্রতিনিধিত্ব করতে পারে এবং বস্তুটি যে প্রেক্ষাপটে এটি বোঝে তার বাইরের কিনা তা গণনা করতে ব্যবহৃত হয়। তাপমাত্রার উদাহরণে, আচরণগত বৈশিষ্ট্যগুলি হতে পারে তাপমাত্রা, আর্দ্রতা এবং চাপ৷

কনটেক্সচুয়াল আউটলায়ার্স হল স্থানীয় আউটলারের একটি সাধারণীকরণ, একটি ধারণা যা ঘনত্ব-ভিত্তিক আউটলায়ার বিশ্লেষণ পদ্ধতিতে প্রবর্তিত হয়। একটি ডেটা সেটের একটি বস্তু একটি স্থানীয় আউটলায়ার যদি এর ঘনত্ব মূলত স্থানীয় এলাকা থেকে বিচ্যুত হয় যেখানে এটি প্রদর্শিত হয়।

গ্লোবাল আউটলায়ার সনাক্তকরণ প্রাসঙ্গিক আউটলায়ার সনাক্তকরণের একটি বিশেষ পদ্ধতি হিসাবে উদ্বিগ্ন হতে পারে যেখানে প্রাসঙ্গিক বৈশিষ্ট্যগুলির গ্রুপটি শূন্য থাকে। অন্য কথায়, গ্লোবাল আউটলায়ার সনাক্তকরণের জন্য প্রসঙ্গ হিসাবে সমগ্র ডেটা সেট প্রয়োজন। প্রাসঙ্গিক বহিঃপ্রকাশ বিশ্লেষণ ব্যবহারকারীদের নমনীয়তা সমর্থন করে যাতে কেউ বিভিন্ন প্রসঙ্গে আউটলায়ার নির্ধারণ করতে পারে, যা বিভিন্ন অ্যাপ্লিকেশনে কাম্য হতে পারে।

সম্মিলিত বহিরাগত − প্রদত্ত ডেটার সেটে, যখন ডেটা পয়েন্টের একটি সেট বাকি তথ্য সেট থেকে বিচ্যুত হয় তখন সমষ্টিগত বহিঃপ্রকাশ হিসাবে পরিচিত হয়। তাই, ডেটা অবজেক্টের নির্দিষ্ট সেট আউটলায়ার হতে পারে না, কিন্তু যখন এটি ডেটা অবজেক্টকে সামগ্রিকভাবে বিবেচনা করতে পারে, তখন তারা আউটলায়ার হিসেবে কাজ করতে পারে।

এটি একাধিক আউটলারের ধরন চিনতে পারে, একাধিক ডেটা অবজেক্ট দ্বারা দেখানো আউটলারদের আচরণের মধ্যে সম্পর্ক সম্পর্কে পটভূমি ডেটার মাধ্যমে যেতে হবে৷


  1. ডেটা মাইনিং ইন্টারফেস কি?

  2. মাইনিং সিকোয়েন্স ডেটার প্রকারগুলি কী কী?

  3. Outliers কি?

  4. ডেটা ইন্টিগ্রিটি কত প্রকার?