কম্পিউটার

অ্যানোমালি সনাক্তকরণের সমস্যাগুলি কী কী?


অসঙ্গতি সনাক্তকরণের বিভিন্ন সমস্যা রয়েছে যা নিম্নরূপ -

একটি অসঙ্গতি সংজ্ঞায়িত করতে ব্যবহৃত বৈশিষ্ট্যের সংখ্যা − যে কোনো বস্তুর প্রশ্নটি একটি স্বতন্ত্র বৈশিষ্ট্যের উপর নির্ভর করে অসামঞ্জস্যপূর্ণ তা সেই বৈশিষ্ট্যের জন্য বস্তুর মান অস্বাভাবিক কিনা তা নিয়ে একটি প্রশ্ন। যেহেতু একটি বস্তুর বেশ কয়েকটি বৈশিষ্ট্য থাকতে পারে, এতে বিভিন্ন বৈশিষ্ট্যের জন্য অস্বাভাবিক মান থাকতে পারে তবে একাধিক বৈশিষ্ট্যের জন্য সাধারণ মান থাকতে পারে।

অধিকন্তু, একটি বস্তু অস্বাভাবিক হতে পারে এমনকি যদি এর কোনো বৈশিষ্ট্যের মান স্বাধীনভাবে অস্বাভাবিক না হয়। উদাহরণস্বরূপ, দুই ফুট লম্বা (শিশু) বা 300 পাউন্ড ওজনের ব্যক্তি থাকা সাধারণ, কিন্তু 300 পাউন্ড ওজনের দুই ফুট লম্বা ব্যক্তি থাকা অস্বাভাবিক৷

একটি অসামঞ্জস্যের বর্ণনাটি সংজ্ঞায়িত করা উচিত যে একটি বস্তু একটি অসঙ্গতি কিনা তা নির্ধারণ করতে একাধিক বৈশিষ্ট্যের মানগুলি কীভাবে ব্যবহার করা হয়। ডেটার মাত্রা বড় হলে এটি একটি অপরিহার্য সমস্যা৷

গ্লোবাল বনাম স্থানীয় দৃষ্টিকোণ − একটি বস্তু সমস্ত বস্তুর ক্ষেত্রে অস্বাভাবিক দেখাতে পারে, কিন্তু তার স্থানীয় আশেপাশের বস্তুর ক্ষেত্রে নয়। উদাহরণস্বরূপ, একজন ব্যক্তি যার উচ্চতা 6 ফুট 5 ইঞ্চি সাধারণ জনসংখ্যার ক্ষেত্রে অত্যন্ত লম্বা, তবে পেশাদার বাস্কেটবল খেলোয়াড়দের ক্ষেত্রে নয়৷

ডিগ্রী যা একটি বিন্দু একটি অসঙ্গতি − একটি বস্তুর মূল্যায়ন একটি অসঙ্গতি বাইনারি ফ্যাশনে কিছু পদ্ধতি দ্বারা নথিভুক্ত করা হয়:একটি বস্তু একটি অসঙ্গতি বা এটি নয়। সাধারণত, এটি মৌলিক বাস্তবতাকে প্রতিফলিত করে না যে কিছু বস্তু অন্যদের তুলনায় আরও তীব্র অসঙ্গতি। অতএব, একটি বস্তু যে মাত্রায় অস্বাভাবিক তা একাধিক মূল্যায়ন করা আকর্ষণীয়। এই মূল্যায়নকে বলা হয় অসঙ্গতি বা আউটলায়ার স্কোর।

এক সময়ে একটি অসামঞ্জস্য শনাক্ত করা বনাম অনেকগুলি অসঙ্গতি একসাথে − কিছু পদ্ধতিতে, অসঙ্গতিগুলি একবারে দূর করা হয়; অর্থাৎ, সবচেয়ে অস্বাভাবিক উদাহরণগুলি স্বীকৃত এবং মুছে ফেলা হয় এবং তারপর পদ্ধতিটি পুনরাবৃত্তি করা হয়। একাধিক কৌশলের জন্য, অসঙ্গতির একটি সেট একসাথে স্বীকৃত হয়।

যে কৌশলগুলি একবারে একটি অসঙ্গতি সনাক্ত করার চেষ্টা করে সেগুলি প্রায়শই মাস্কিং নামক একটি সমস্যার সাপেক্ষে থাকে, যেখানে একাধিক অসঙ্গতির উপস্থিতি সকলের উপস্থিতি মুখোশ করে। অন্যান্য পদে, যে কৌশলগুলি একবারে একাধিক বহিরাগতকে চিহ্নিত করে সেগুলি জলাবদ্ধতার অভিজ্ঞতা লাভ করতে পারে, যেখানে সাধারণ বস্তুগুলিকে বহিরাগত হিসাবে সংজ্ঞায়িত করা হয়। মডেল-ভিত্তিক পদ্ধতিতে, এই প্রভাবগুলি উপস্থিত হতে পারে কারণ অসঙ্গতিগুলি ডেটা মডেলকে পরিবর্তন করে৷

দক্ষতা - বেশ কিছু অসঙ্গতি সনাক্তকরণ স্কিমের গণনামূলক খরচের মধ্যে গুরুত্বপূর্ণ পার্থক্য রয়েছে। শ্রেণীবিভাগ-ভিত্তিক স্কিমগুলির শ্রেণীবিভাগ মডেল তৈরির জন্য প্রয়োজনীয় সংস্থানগুলির প্রয়োজন হতে পারে, তবে সাধারণত এটি ব্যবহার করা সস্তা। একইভাবে, পরিসংখ্যান পদ্ধতি একটি পরিসংখ্যানগত মডেল তৈরি করে এবং ধ্রুবক সময়ের মধ্যে একটি উপাদানকে শ্রেণিবদ্ধ করতে পারে।


  1. জেএসপিতে সেশন অবজেক্ট কী?

  2. সি টোকেন কি?

  3. C# এ মন্তব্য কি?

  4. পাইথনে একটি ফাইল অবজেক্টের বৈশিষ্ট্যগুলি কী কী?