যখন রিগ্রেশন মডেল তৈরি করা হচ্ছে, মাল্টিকোলিনিয়ারিটি পরীক্ষা করা হয়। এর কারণ আমাদের ক্রমাগত ভেরিয়েবলের বিভিন্ন সমন্বয়ের মধ্যে বিদ্যমান পারস্পরিক সম্পর্ক বুঝতে হবে। যদি ভেরিয়েবলের মধ্যে মাল্টিকোলিনিয়ারিটি বিদ্যমান থাকে, তাহলে আমাদের নিশ্চিত করতে হবে যে এটি ডেটা থেকে মুছে ফেলা হয়েছে।
বাস্তব জগতে ডেটা সাধারণত অ-রৈখিক হয়। মডেলে এই ধরনের নন-লিনিয়ার ডেটা ফিট করার জন্য আমাদের মেকানিজম খুঁজে বের করতে হবে। এই ডেটাটি কল্পনা করতে আমরা Anscombe-এর ডেটাসেট ব্যবহার করব৷
৷'ইমপ্লট' ফাংশনটি নন-লিনিয়ার ডেটা -
এর সাথে ব্যবহার করা হয়উদাহরণ
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3) plt.show()
আউটপুট
ব্যাখ্যা
- প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷ ৷
- ইনপুট ডেটা হল 'অ্যান্সকম্ব' যা সমুদ্রের লাইব্রেরি থেকে লোড করা হয়৷
- এই ডেটা একটি ডেটাফ্রেমে সংরক্ষিত থাকে৷ ৷
- 'load_dataset' ফাংশনটি আইরিস ডেটা লোড করতে ব্যবহৃত হয়।
- এই ডেটা 'ইমপ্লট' ফাংশন ব্যবহার করে কল্পনা করা হয়।
- এখানে, ডেটাফ্রেম প্যারামিটার হিসাবে সরবরাহ করা হয়েছে।
- এছাড়া, x মান, y মান এবং অর্ডার নির্দিষ্ট করা আছে।
- এই ডেটা কনসোলে প্রদর্শিত হয়৷ ৷