Bayesian ক্লাসিফায়ার হল পরিসংখ্যানগত ক্লাসিফায়ার। এটি ক্লাস সদস্যতার সম্ভাবনার পূর্বাভাস দিতে পারে, যেমন সম্ভাব্যতা যে প্রদত্ত নমুনা একটি নির্দিষ্ট শ্রেণিতে প্রয়োগ করা হয়েছে। বায়েসিয়ান ক্লাসিফায়ারগুলি যখন উচ্চ ডেটাবেস থাকতে পারে তখন তারা বড় দক্ষতা এবং গতিও প্রদর্শন করেছে৷
যেহেতু ক্লাসগুলি সংজ্ঞায়িত করা হয়েছে, সিস্টেমটিকে অবশ্যই এমন নিয়মগুলি অনুমান করতে হবে যা শ্রেণিবিন্যাসের তত্ত্বাবধান করে, তাই সিস্টেমটি অবশ্যই প্রতিটি শ্রেণীর বর্ণনা আবিষ্কার করতে সক্ষম হবে। বর্ণনাগুলিকে অবশ্যই প্রশিক্ষণ সেটের ভবিষ্যদ্বাণীমূলক বৈশিষ্ট্যগুলিকে সংজ্ঞায়িত করতে হবে যাতে শুধুমাত্র ইতিবাচক দৃষ্টান্তগুলি বর্ণনাকে সন্তুষ্ট করতে পারে, নেতিবাচক দৃষ্টান্তগুলি নয়৷ একটি নিয়মকে সঠিক বলা হয় যদি এর বর্ণনায় সমস্ত ইতিবাচক উদাহরণ থাকে এবং একটি শ্রেণির নেতিবাচক উদাহরণগুলির একটিও কভার না করা হয়৷
এটি অনুমান করা হচ্ছে যে সমস্ত বৈশিষ্ট্যের অবদানগুলি স্বাধীন এবং প্রতিটি শ্রেণীবিভাগ সমস্যায় সমানভাবে অবদান রাখে, একটি সাধারণ শ্রেণিবিন্যাসের স্কিম যাকে বলা হয় Naïve Bayes শ্রেণীবিভাগ।
Naïve Bayes শ্রেণীবিভাগকে Naïve বলা হয় কারণ এটি শ্রেণি শর্তাধীন স্বাধীনতা ধরে নেয়। একটি প্রদত্ত শ্রেণীর একটি বৈশিষ্ট্য মান প্রয়োগ একাধিক বৈশিষ্ট্য মান থেকে পৃথক. এই অনুমানটি গণনামূলক খরচ হ্রাস করার জন্য তৈরি করা হয় এবং তাই নির্বোধ হিসাবে বিবেচিত হয়।
পর্যবেক্ষণযোগ্য ভেরিয়েবল প্রদত্ত প্রশিক্ষণ রেকর্ড থেকে নেটওয়ার্ক টপোলজি বোঝার জন্য একাধিক অ্যালগরিদম বিদ্যমান। সমস্যাটি বিচ্ছিন্ন অপ্টিমাইজেশন। মানব পেশাদারদের সাধারণত প্রত্যক্ষ শর্তাধীন নির্ভরতা সম্পর্কে ভাল ধারণা থাকে যা বিশ্লেষণের অধীনে ডোমেনকে প্রভাবিত করে, যা নেটওয়ার্ক ডিজাইনকে সমর্থন করে। বিশেষজ্ঞদের নোডগুলির জন্য শর্তসাপেক্ষ সম্ভাব্যতা সংজ্ঞায়িত করা উচিত যা সরাসরি নির্ভরশীলতায় কাজ করে।
এই সম্ভাব্যতাগুলি অবশিষ্ট সম্ভাব্যতার মানগুলি মূল্যায়ন করতে ব্যবহার করা যেতে পারে। যদি নেটওয়ার্ক টপোলজি স্বীকার করা হয় এবং ভেরিয়েবলগুলি পর্যবেক্ষণযোগ্য হয়, তাই নেটওয়ার্ককে প্রশিক্ষণ দেওয়া সহজ। এটিতে CPT এন্ট্রিগুলির গণনা অন্তর্ভুক্ত রয়েছে, যেমনটি নিষ্পাপ বায়েসিয়ান শ্রেণীবিভাগে অন্তর্ভুক্ত সম্ভাব্যতাগুলি মূল্যায়ন করার সময় একইভাবে সম্পন্ন হয়৷
Naïve Bayes Classifier-এর বিভিন্ন বৈশিষ্ট্য রয়েছে যা নিম্নরূপ -
তারা বিচ্ছিন্ন নয়েজ পয়েন্টের জন্য শক্তিশালী কারণ ডেটা থেকে শর্তসাপেক্ষ সম্ভাব্যতা অনুমান করার সময় এই ধরনের পয়েন্টগুলি গড় করা হয়। এটি মডেল নির্মাণ এবং শ্রেণীবিভাগের সময় দৃষ্টান্তগুলি মুছে ফেলার মাধ্যমে অনুপস্থিত মানগুলি পরিচালনা করতে পারে৷
তারা অপ্রাসঙ্গিক বৈশিষ্ট্যের জন্য শক্তিশালী। যদি Xi একটি অনুপযুক্ত বৈশিষ্ট্য, তাই P (Xi |Y) ধারাবাহিকভাবে বিতরণ করা হয়। Xi এর জন্য শ্রেণী শর্তাধীন সম্ভাবনা পরবর্তী সম্ভাব্যতার সম্পূর্ণ গণনার উপর কোন প্রভাব নেই।
পারস্পরিক সম্পর্কযুক্ত বৈশিষ্ট্যগুলি নিষ্পাপ বেইস শ্রেণীবিভাগের কর্মক্ষমতা হ্রাস করতে পারে কারণ শর্তসাপেক্ষ স্বাধীনতা অনুমান এই ধরনের বৈশিষ্ট্যগুলির জন্য আর ধারণ করে না। উদাহরণস্বরূপ, নিম্নলিখিত সম্ভাব্যতাগুলি বিবেচনা করুন −
P (A=0|Y=0) =0.4, P (A=1 | Y=0) =0.6,
P (A=0|Y =1) =0.6, P (A=1 | Y =1) =0.4,
যেখানে A হল একটি বাইনারি অ্যাট্রিবিউট এবং Y হল একটি বাইনারি ক্লাস ভেরিয়েবল। ধরুন অন্য একটি বাইনারি অ্যাট্রিবিউট B আছে যা Y =0 হলে A এর সাথে পুরোপুরি সম্পর্কযুক্ত, কিন্তু Y =1 হলে A থেকে স্বতন্ত্র। অখণ্ডতার জন্য, বিবেচনা করুন যে B-এর জন্য শ্রেণী-শর্তযুক্ত সম্ভাবনাগুলি A-এর সমান।