কম্পিউটার

বৈষম্যমূলক বিশ্লেষণ কর্মক্ষমতা কি?


বৈষম্যমূলক বিশ্লেষণ পদ্ধতি শ্রেণীবিন্যাস স্কোরগুলিতে উপস্থিত হওয়ার জন্য দুটি প্রধান অনুমানের উপর নির্ভর করে - প্রথমত, এটি বিবেচনা করে যে কিছু শ্রেণিতে ভবিষ্যদ্বাণীকারী পরিমাপ একটি মাল্টিভেরিয়েট স্বাভাবিক বন্টন থেকে প্রদর্শিত হয়। যখন এই অনুমানটি যুক্তিসঙ্গতভাবে একত্র করা হয়, তখন বৈষম্যমূলক বিশ্লেষণ হল লজিস্টিক রিগ্রেশন সহ অন্যান্য শ্রেণীবিন্যাস পদ্ধতির তুলনায় একটি গতিশীল হাতিয়ার।

এটি প্রদর্শিত হয় যে বৈষম্যমূলক বিশ্লেষণ লজিস্টিক রিগ্রেশনের চেয়ে 30% বেশি কার্যকর যদি ডেটা মাল্টিভেরিয়েট স্বাভাবিক হয়, সমান ফলাফলে পৌঁছানোর জন্য 30% কম রেকর্ডের প্রয়োজন হয়। এটি প্রদর্শিত হয়েছে যে এই পদ্ধতিটি স্বাভাবিকতা থেকে সরে যাওয়ার জন্য তুলনামূলকভাবে শক্তিশালী এই অর্থে যে ভবিষ্যদ্বাণীকারীরা অ-স্বাভাবিক এবং এমনকি ডামি ভেরিয়েবল হতে পারে৷

ক্ষুদ্রতম শ্রেণীটি পর্যাপ্ত পরিমাণে বড় (প্রায় 20টিরও বেশি রেকর্ড) বিবেচনা করে এটি সত্য। এই পদ্ধতিটিকে পৃথক ভবিষ্যদ্বাণীকারীর একবিভিন্ন এলাকা এবং বহুবিভিন্ন এলাকায় উভয় ক্ষেত্রেই বহিরাগতদের প্রতি সংবেদনশীল হিসাবে উল্লেখ করা হয়। অন্বেষণমূলক বিশ্লেষণ চরম পদ্ধতিগুলি সনাক্ত করতে এবং সেগুলি সরানো যায় কিনা তা নির্ধারণ করতে ব্যবহার করা উচিত৷

বৈষম্যমূলক বিশ্লেষণের পর দ্বিতীয় অনুমানটি হল যে একটি শ্রেণীর অভ্যন্তরে একাধিক ভবিষ্যদ্বাণীকারীর মধ্যে পারস্পরিক সম্পর্ক কাঠামো শ্রেণী জুড়ে একই। প্রতিটি শ্রেণীর জন্য আলাদাভাবে ভবিষ্যদ্বাণীকারীদের মধ্যে পারস্পরিক সম্পর্ক ম্যাট্রিক্স গণনা করে এবং ম্যাট্রিক্সের তুলনা করে এটি পরীক্ষা করা যেতে পারে।

যদি পারস্পরিক সম্পর্কগুলি ক্লাস জুড়ে যথেষ্ট বৈপরীত্য হয়, শ্রেণীবিভাগকারী সর্বোচ্চ পরিবর্তনশীলতার সাথে ক্লাসে রেকর্ডগুলিকে সংজ্ঞায়িত করতে প্রভাবিত করবে। যখন পারস্পরিক সম্পর্ক কাঠামো মূলত ভিন্ন হয় এবং ডেটাসেট উচ্চ হয়, তখন একটি বিকল্প হল দ্বিঘাত বৈষম্যমূলক বিশ্লেষণের প্রয়োজন৷

একটি মধ্যপন্থী পদ্ধতি হল স্বাভাবিকতা এবং পারস্পরিক সম্পর্কের বিষয়ে কিছু অনুসন্ধানমূলক বিশ্লেষণ চার্জ করা, একটি মডেলকে প্রশিক্ষণ দেওয়া এবং গণনা করা, তারপরে, শ্রেণীবিভাগের নির্ভুলতার উপর ভিত্তি করে এবং এটি মূল অন্বেষণ থেকে যা শিখেছে তার উপর ভিত্তি করে, বৃত্তাকার এবং আরও অন্বেষণ করা উচিত যে বহিরাগতদের পরীক্ষা করা উচিত বা ভবিষ্যদ্বাণী করা উচিত কিনা। ভেরিয়েবল পুনরায় পরিদর্শন করা হয়েছে।

কম্পিউটিং কর্মক্ষমতা জন্য বৈধতা গ্রুপ ব্যবহার করার জন্য একই যুক্তি এখনও বহন করে. উদাহরণস্বরূপ, রাইডিং মাওয়ার পরিবারে 1, 13 এবং 17 ভুল শ্রেণিবদ্ধ করা হয়েছে। এর মানে হল এই রেকর্ডগুলির জন্য মডেলটি 12.5% ​​এর একটি ত্রুটির হার দেয়৷

এই হার একটি পক্ষপাতমূলক পরিমাপ-এটি আশাবাদী কারণ এটি শ্রেণীবিন্যাস ফাংশন ফিট করার জন্য এবং ত্রুটি গণনা করার জন্য সমান ডেটা ব্যবহার করা যেতে পারে। তাই, বেশ কয়েকটি মডেলের মতো, এটি একটি বৈধতা সেটের কার্যকারিতা পরীক্ষা করতে পারে যাতে এমন ডেটা রয়েছে যা শ্রেণীবিভাগ ফাংশন গণনা করার জন্য অন্তর্ভুক্ত ছিল না।

এটি একটি বৈষম্যমূলক বিশ্লেষণ থেকে বিভ্রান্তি ম্যাট্রিক্স পেতে পারে, এটির জন্য শ্রেণীবিভাগের স্কোরগুলি সঠিকভাবে বা প্রবণতা (শ্রেণীভুক্তির সম্ভাবনা) প্রয়োজন হতে পারে যা শ্রেণীবিভাগ স্কোর থেকে গণনা করা হয়। উভয় ক্ষেত্রেই, এটি নির্ধারণ করা হয় প্রতিটি রেকর্ডের ক্লাস অ্যাসাইনমেন্ট সবচেয়ে বড় স্কোর বা সম্ভাব্যতার উপর নির্ভর করে। এটি এই ডেটার প্রকৃত শ্রেণীর সদস্যতার সাথে এই শ্রেণীবিভাগের তুলনা করতে পারে। এটি বিভ্রান্তি ম্যাট্রিক্স প্রদান করে।


  1. নিরাপত্তা মেট্রিক্সের শ্রেণীবিভাগ কি?

  2. তথ্য সুরক্ষায় নিরাপত্তা আক্রমণের শ্রেণীবিভাগ কি?

  3. সি টোকেন কি?

  4. C# এ মন্তব্য কি?