Bayesian ক্লাসিফায়ার হল পরিসংখ্যানগত ক্লাসিফায়ার। তারা ক্লাস সদস্যতার সম্ভাব্যতা ভবিষ্যদ্বাণী করতে পারে, যেমন সম্ভাব্যতা যে একটি প্রদত্ত নমুনা একটি নির্দিষ্ট শ্রেণীর অন্তর্গত। একটি বড় ডাটাবেসে প্রয়োগ করার সময় বায়েসিয়ান ক্লাসিফায়ারগুলি উচ্চ নির্ভুলতা এবং গতিও প্রদর্শন করেছে৷
একবার ক্লাস সংজ্ঞায়িত করা হলে, সিস্টেমের এমন নিয়মগুলি অনুমান করা উচিত যা শ্রেণীবিভাগ পরিচালনা করে, তাই সিস্টেমটি প্রতিটি শ্রেণীর বর্ণনা খুঁজে পেতে সক্ষম হওয়া উচিত। বর্ণনাগুলি শুধুমাত্র প্রশিক্ষণ সেটের ভবিষ্যদ্বাণীমূলক বৈশিষ্ট্যগুলিকে উল্লেখ করা উচিত যাতে শুধুমাত্র ইতিবাচক উদাহরণগুলি বর্ণনাকে সন্তুষ্ট করতে পারে, নেতিবাচক উদাহরণ নয়। একটি নিয়মকে সঠিক বলা হয় যদি এর বর্ণনায় সমস্ত ইতিবাচক উদাহরণ থাকে এবং একটি শ্রেণির নেতিবাচক উদাহরণগুলির একটিও কভার না করা হয়৷
এটি অনুমান করা হচ্ছে যে সমস্ত বৈশিষ্ট্যের অবদানগুলি স্বাধীন এবং প্রতিটি শ্রেণীবিভাগ সমস্যায় সমানভাবে অবদান রাখে, একটি সাধারণ শ্রেণিবিন্যাসের স্কিম যাকে বলা হয় Naïve Bayes শ্রেণীবিভাগ। প্রতিটি "স্বাধীন" বৈশিষ্ট্যের অবদান বিশ্লেষণ করে, একটি শর্তাধীন সম্ভাব্যতা নির্ধারণ করা হয়। ভবিষ্যদ্বাণীর উপর বিভিন্ন বৈশিষ্ট্যের প্রভাবকে একত্রিত করে একটি শ্রেণিবিন্যাস করা হয়।
Naïve Bayes শ্রেণীবিভাগকে Naïve বলা হয় কারণ এটি শ্রেণি শর্তাধীন স্বাধীনতা ধরে নেয়। একটি প্রদত্ত শ্রেণীর উপর একটি বৈশিষ্ট্য মানের প্রভাব অন্যান্য বৈশিষ্ট্যের মান থেকে স্বাধীন। এই অনুমানটি গণনামূলক খরচ কমাতে তৈরি করা হয়েছে এবং তাই নির্বোধ বলে বিবেচিত হয়৷
৷বেইস থিওরেম - X কে একটি ডেটা টিপল হতে দিন। বায়েসিয়ান পরিভাষায়, Xকে "প্রমাণ" হিসাবে বিবেচনা করা হয়। H কে কিছু অনুমান করা যাক, যেমন ডেটা টিপল X একটি নির্দিষ্ট শ্রেণী C এর অন্তর্গত। সম্ভাব্যতা P (H|X) ডেটা শ্রেণীবদ্ধ করার জন্য নির্ধারিত হয়। এই সম্ভাব্যতা P (H|X) হল সম্ভাব্যতা যা হাইপোথিসিস ধারণ করে "প্রমাণ" বা পর্যবেক্ষণ করা ডেটা টিপল X।
পি (এইচ 20,000 আয়। ধরুন যে H হল অনুমান যে গ্রাহক একটি কম্পিউটার কিনবেন। তারপর P (H|X) সম্ভাব্যতা প্রতিফলিত করে যে গ্রাহকের বয়স এবং আয় জানা থাকলে গ্রাহক X একটি কম্পিউটার কিনবেন।
P (H) হল H এর পূর্বের সম্ভাবনা। উদাহরণস্বরূপ, এটি হল সম্ভাব্যতা যে কোনো প্রদত্ত গ্রাহক একটি কম্পিউটার কিনবেন, বয়স, আয় বা অন্য কোনো তথ্য নির্বিশেষে। পূর্ববর্তী সম্ভাব্যতা P (H|X) পূর্ববর্তী সম্ভাব্যতা P (H) এর চেয়ে বেশি তথ্যের উপর ভিত্তি করে, যা X থেকে স্বাধীন।
একইভাবে, পি (এক্স 20,000।
প্রদত্ত ডেটা থেকে P (H), P (X|H), এবং P (X) অনুমান করা যেতে পারে। Bayes উপপাদ্য P(H|X), P(H), P(X|H), এবং P(X) থেকে পশ্চাদবর্তী সম্ভাব্যতা P (H|X) গণনা করার একটি উপায় প্রদান করে। এটি
দ্বারা প্রদত্ত$$P(H|X)=\frac{P(X|H)P(H)}{P(X)}$$