কম্পিউটার

পাইথনে ডেটার অ-রৈখিক প্রবণতা বোঝার জন্য একটি বহুপদী রিগ্রেশন মডেল কীভাবে উপযুক্ত হতে পারে?


যখন রিগ্রেশন মডেল তৈরি করা হচ্ছে, মাল্টিকোলিনিয়ারিটি পরীক্ষা করা হয়। এর কারণ আমাদের ক্রমাগত ভেরিয়েবলের বিভিন্ন সমন্বয়ের মধ্যে বিদ্যমান পারস্পরিক সম্পর্ক বুঝতে হবে। যদি ভেরিয়েবলের মধ্যে মাল্টিকোলিনিয়ারিটি বিদ্যমান থাকে, তাহলে আমাদের নিশ্চিত করতে হবে যে এটি ডেটা থেকে মুছে ফেলা হয়েছে।

বাস্তব জগতে ডেটা সাধারণত অ-রৈখিক হয়। মডেলে এই ধরনের নন-লিনিয়ার ডেটা ফিট করার জন্য আমাদের মেকানিজম খুঁজে বের করতে হবে। এই ডেটাটি কল্পনা করতে আমরা Anscombe-এর ডেটাসেট ব্যবহার করব৷

'ইমপ্লট' ফাংশনটি নন-লিনিয়ার ডেটা -

এর সাথে ব্যবহার করা হয়

উদাহরণ

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('anscombe')
sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3)
plt.show()

আউটপুট

পাইথনে ডেটার অ-রৈখিক প্রবণতা বোঝার জন্য একটি বহুপদী রিগ্রেশন মডেল কীভাবে উপযুক্ত হতে পারে?

ব্যাখ্যা

  • প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷
  • ইনপুট ডেটা হল 'অ্যান্সকম্ব' যা সমুদ্রের লাইব্রেরি থেকে লোড করা হয়৷
  • এই ডেটা একটি ডেটাফ্রেমে সংরক্ষিত থাকে৷
  • 'load_dataset' ফাংশনটি আইরিস ডেটা লোড করতে ব্যবহৃত হয়।
  • এই ডেটা 'ইমপ্লট' ফাংশন ব্যবহার করে কল্পনা করা হয়।
  • এখানে, ডেটাফ্রেম প্যারামিটার হিসাবে সরবরাহ করা হয়েছে।
  • এছাড়া, x মান, y মান এবং অর্ডার নির্দিষ্ট করা আছে।
  • এই ডেটা কনসোলে প্রদর্শিত হয়৷

  1. পাইথনে ভেরিয়েবলের একটি পৃথক মান হলে ডেটাতে মানগুলিকে ফিট করার জন্য কীভাবে 'ইমপ্লট' ফাংশন ব্যবহার করা যেতে পারে?

  2. পাইথনে Seaborn ব্যবহার করে কীভাবে একটি রৈখিক সম্পর্ক কল্পনা করা যায়?

  3. পাইথন সিবোর্ন লাইব্রেরিতে ডেটা ভিজ্যুয়ালাইজ করতে কীভাবে ফেসেটগ্রিড ব্যবহার করা যেতে পারে?

  4. পাইথনের একটি মডেলের সাথে নন-লিনিয়ার ডেটা কীভাবে ফিট হতে পারে?