একটি শ্রেণীবিভাগ পদ্ধতি যা যথেষ্ট যাচাই-বাছাই পেয়েছে তা হল সমর্থন ভেক্টর মেশিন (SVM)। এই পদ্ধতির শিকড় পরিসংখ্যানগত শিক্ষা তত্ত্বের মধ্যে রয়েছে এবং এটি হাতে লেখা অঙ্ক শনাক্তকরণ থেকে পাঠ্য শ্রেণিবিন্যাস পর্যন্ত বেশ কিছু ব্যবহারিক প্রয়োগে প্রতিশ্রুতিশীল অভিজ্ঞতামূলক ফলাফল প্রদর্শন করেছে।
SVM উচ্চ-মাত্রিক ডেটার সাথেও কাজ করে এবং মাত্রিকতার সমস্যাগুলির অভিশাপ প্রতিরোধ করে। এই পদ্ধতির দ্বিতীয় উপাদানটি হল এটি প্রশিক্ষণের উদাহরণগুলির একটি উপসেট ব্যবহার করে সিদ্ধান্তের সীমানা নির্ধারণ করে, যাকে সমর্থন ভেক্টর বলা হয়৷
রৈখিকভাবে বিভাজ্য ডেটাতে এই ধরনের হাইপারপ্লেনকে স্পষ্টভাবে দেখার জন্য SVM প্রস্তুত করা যেতে পারে। এটি প্রদর্শন করে অর্জন করতে পারে কিভাবে SVM পদ্ধতিটি অ-রৈখিকভাবে বিভাজ্য ডেটাতে চালিয়ে যেতে পারে। ডেটা সেটটি রৈখিকভাবে বিভাজ্য; অর্থাৎ, এটি হাইপারপ্লেনের একপাশে থাকা সমস্ত বর্গক্ষেত্র এবং বিভিন্ন দিকে থাকা সমস্ত বৃত্ত সহ একটি হাইপারপ্লেন আবিষ্কার করতে পারে৷
একটি রৈখিক মডেলের ক্ষমতা তার মার্জিনের সাথে বিপরীতভাবে যুক্ত। ছোট মার্জিন সহ মডেলগুলির ক্ষমতা বেশি থাকে কারণ তারা গতিশীল এবং উচ্চ মার্জিন সহ মডেলগুলির বিপরীতে কিছু প্রশিক্ষণ সেট ফিট করতে পারে। SRM নীতি অনুসারে, ক্ষমতা বাড়ার সাথে সাথে সাধারণীকরণের ত্রুটি বাড়তে পারে। তাই, রৈখিক শ্রেণিবিন্যাস করা বাঞ্ছনীয় যেগুলি তাদের সিদ্ধান্তের সীমানার মার্জিনকে সর্বাধিক করে তোলে যাতে তাদের সবচেয়ে খারাপ-কেস সাধারণীকরণ ত্রুটিগুলি হ্রাস পায়৷
একটি রৈখিক SVM হল একটি শ্রেণীবদ্ধকারী যা সর্বোচ্চ মার্জিন সহ একটি হাইপারপ্লেন পরীক্ষা করে, যাকে সর্বাধিক মার্জিন শ্রেণীবিভাগ বলা হয়। এটি শিখতে পারে কিভাবে SVM এই ধরনের একটি সীমানা শিখে, এটি একটি লিনিয়ার ক্লাসিফায়ারের সিদ্ধান্তের সীমানা এবং মার্জিন সম্পর্কে কিছু প্রাথমিক বিশ্লেষণ দিয়ে শুরু করতে পারে।
SVM এর বিভিন্ন বৈশিষ্ট্য রয়েছে যা নিম্নরূপ -
SVM শেখার সমস্যা একটি উত্তল অপ্টিমাইজেশান সমস্যা হিসাবে সংগঠিত হতে পারে, যেখানে কার্যকর অ্যালগরিদমগুলি বিশ্বব্যাপী সর্বনিম্ন উদ্দেশ্য ফাংশন আবিষ্কার করতে অ্যাক্সেসযোগ্য। নিয়ম-ভিত্তিক শ্রেণিবিন্যাসকারী এবং কৃত্রিম নিউরাল নেটওয়ার্ক সহ বিভিন্ন শ্রেণিবিন্যাস পদ্ধতি রয়েছে যা অনুমানের এলাকা অনুসন্ধান করার জন্য একটি লোভ-ভিত্তিক পদ্ধতি ব্যবহার করে। এই ধরনের পদ্ধতিগুলি শুধুমাত্র স্থানীয়ভাবে সর্বোত্তম সমাধান খুঁজে পেতে প্রভাবিত করে৷
SVM সিদ্ধান্তের সীমানার মার্জিন বড় করে ক্ষমতা নিয়ন্ত্রণ প্রয়োগ করে। ব্যবহারকারীকে ব্যবহার করার জন্য কার্নেল ফাংশনের ধরন এবং প্রতিটি স্ল্যাক ভেরিয়েবল অফার করার জন্য খরচ ফাংশন সি সহ বেশ কয়েকটি প্যারামিটার প্রদান করা উচিত।
ডেটাতে দেখানো প্রতিটি শ্রেণীবদ্ধ বৈশিষ্ট্যের মানগুলির জন্য ডামি ভেরিয়েবল শেখার মাধ্যমে SVM শ্রেণীবদ্ধ রেকর্ড করতে ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, যদি বৈবাহিক অবস্থার তিনটি মান থাকে যেমন অবিবাহিত, বিবাহিত, তালাকপ্রাপ্ত এবং এটি প্রতিটি বৈশিষ্ট্যের মানগুলির জন্য একটি বাইনারি পরিবর্তনশীল শিখতে পারে।