রিগ্রেশন
রিগ্রেশন তত্ত্বাবধানে থাকা মেশিন লার্নিং পদ্ধতির একটি প্রকারকে সংজ্ঞায়িত করে যেটি যেকোনো একটানা-মূল্যবান বৈশিষ্ট্যের পূর্বাভাস দিতে ব্যবহার করা যেতে পারে। রিগ্রেশন লক্ষ্য পরিবর্তনশীল এবং ভবিষ্যদ্বাণীকারী পরিবর্তনশীল সমিতিগুলি অন্বেষণ করার জন্য কিছু ব্যবসা প্রতিষ্ঠান প্রদান করে। আর্থিক পূর্বাভাস এবং সময় সিরিজ মডেলিংয়ের জন্য ব্যবহার করা যেতে পারে এমন ডেটা অন্বেষণ করার জন্য এটি একটি অপরিহার্য হাতিয়ার৷
ডেটা একটি ফাংশনে ডেটা ফিট করে মসৃণ করা যেতে পারে, যেমন রিগ্রেশনের মাধ্যমে। রৈখিক রিগ্রেশনের মধ্যে রয়েছে দুটি বৈশিষ্ট্য (বা ভেরিয়েবল) ফিট করার জন্য "সেরা" লাইন আবিষ্কার করা যাতে একটি বৈশিষ্ট্য অন্যটির পূর্বাভাস দিতে ব্যবহার করা যেতে পারে। বেশ কিছু লিনিয়ার রিগ্রেশন হল লিনিয়ার রিগ্রেশনের একটি অগ্রগতি, যেখানে দুটির বেশি অ্যাট্রিবিউট অন্তর্ভুক্ত করা হয় এবং ডেটা একটি বহুমাত্রিক স্পেসের জন্য উপযুক্ত৷
রৈখিক রিগ্রেশনে, ডেটা একটি সরল রেখায় ফিট করার জন্য মডেল করা হয়। উদাহরণস্বরূপ, একটি র্যান্ডম ভেরিয়েবল, y (যাকে রেসপন্স ভেরিয়েবল বলা হয়), অন্য র্যান্ডম ভেরিয়েবলের রৈখিক ফাংশন হিসাবে মডেল করা যেতে পারে, x (একটি ভবিষ্যদ্বাণীকারী পরিবর্তনশীল বলা হয়), সমীকরণ y =wx+b সহ, যেখানে y এর প্রকরণ বিবেচনা করা হয় ধ্রুবক হতে।
রিগ্রেশন সমস্যাগুলি ইনপুট মানগুলিতে স্থাপন করা একটি আউটপুট মানের গণনার সাথে পরিচালনা করে। যখন শ্রেণীবিভাগের জন্য ব্যবহার করা হয়, ইনপুট মানগুলি ডাটাবেসের মান এবং আউটপুট মানগুলি ক্লাসগুলিকে উপস্থাপন করে। শ্রেণীবিন্যাস সমস্যা অন্বেষণ করতে রিগ্রেশন ব্যবহার করা যেতে পারে, তবে এটি পূর্বাভাসের মতো একাধিক অ্যাপ্লিকেশনের জন্য ব্যবহার করা যেতে পারে। রিগ্রেশনের প্রাথমিক গঠন হল সরল রৈখিক রিগ্রেশন যাতে শুধুমাত্র একটি ভবিষ্যদ্বাণী এবং একটি ভবিষ্যদ্বাণী থাকে।
শ্রেণীবিন্যাস
শ্রেণীবিভাগ হল এমন একটি মডেল আবিষ্কার করার পদ্ধতি যা উপাত্ত শ্রেণী বা ধারণার প্রতিনিধিত্ব করে এবং আলাদা করে, যার উদ্দেশ্য হল মডেল ব্যবহার করে বস্তুর শ্রেণী ভবিষ্যদ্বাণী করার জন্য যার শ্রেণী লেবেল বেনামী। প্রাপ্ত মডেলটি প্রশিক্ষণ রেকর্ডের একটি গ্রুপের বিশ্লেষণের উপর ভিত্তি করে (অর্থাৎ, ডেটা অবজেক্ট যার ক্লাস লেবেল পরিচিত)।
প্রতিটি টিপলকে একটি পূর্বনির্ধারিত শ্রেণির অন্তর্গত হিসাবে বিবেচনা করা হয়, যেমন একটি বৈশিষ্ট্য দ্বারা নির্ধারিত হয়, যাকে ক্লাস লেবেল বৈশিষ্ট্য বলা হয়। শ্রেণিবিন্যাসের কাঠামোতে, ডেটা টিপলগুলিকে নমুনা, উদাহরণ বা বস্তু হিসাবে উপস্থাপন করা হয়। মডেল তৈরি করতে বিশ্লেষণ করা ডেটা টিপলগুলি সম্মিলিতভাবে প্রশিক্ষণ ডেটা সেট তৈরি করে। প্রশিক্ষণ সেট তৈরি করা পৃথক টিপলগুলিকে প্রশিক্ষণের নমুনা হিসাবে উপস্থাপন করা হয় এবং নমুনা জনসংখ্যা থেকে নির্বাচন করা হয়।
যেহেতু প্রতিটি প্রশিক্ষণের নমুনার ক্লাস লেবেল সরবরাহ করা হয়, এই প্রক্রিয়াটিকে তত্ত্বাবধানে শিক্ষা হিসাবেও সংজ্ঞায়িত করা হয়। তত্ত্বাবধানহীন শিক্ষায়, যেখানে প্রশিক্ষণের নমুনাগুলির ক্লাস লেবেলগুলি অজানা, এবং বোঝার জন্য বিভিন্ন ক্লাসগুলি আগে থেকে জানা যায় না৷