কম্পিউটার

একটি পান্ডাস ডেটাফ্রেমে দুটি সংখ্যাসূচক কলামের মধ্যে পারস্পরিক সম্পর্ক


আমরা pandas.DataFrame.corr ব্যবহার করতে পারি NULL মান বাদ দিয়ে কলামের জোড়াভিত্তিক পারস্পরিক সম্পর্ক গণনা করতে। পারস্পরিক সম্পর্ক সহগ দুটি ভেরিয়েবলের মধ্যে রৈখিক সংযোগের শক্তি নির্দেশ করে। সহগ রেঞ্জ -1 এবং 1 এর মধ্যে।

একটি পান্ডাস ডেটাফ্রেমে দুটি সংখ্যাসূচক কলামের মধ্যে পারস্পরিক সম্পর্ক পেতে, আমরা নিম্নলিখিত পদক্ষেপগুলি নিতে পারি -

  • চিত্রের আকার সেট করুন এবং সাবপ্লটের মধ্যে এবং চারপাশে প্যাডিং সামঞ্জস্য করুন।
  • দ্বি-মাত্রিক, আকার-পরিবর্তনযোগ্য, সম্ভাব্য ভিন্ন ভিন্ন ট্যাবুলার ডেটার একটি পান্ডাস ডেটাফ্রেম তৈরি করুন৷
  • দুটি কলামের মান তুলনা করুন এবং col1.corr(col2) ব্যবহার করে পারস্পরিক সম্পর্ক সহগ গণনা করুন।
  • কনসোলে পারস্পরিক সম্পর্ক সহগ মুদ্রণ করুন।
  • চিত্রটি প্রদর্শন করতে, শো() ব্যবহার করুন পদ্ধতি।

উদাহরণ

import pandas as pd
from matplotlib import pyplot as plt

plt.rcParams["figure.figsize"] = [7.00, 3.50]
plt.rcParams["figure.autolayout"] = True

df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]})

col1 = df['lab']
col2 = df['value']

plt.plot(col1, col2)

print("The correlation coefficient is: ", col1.corr(col2))

plt.show()

আউটপুট

এটি নিম্নলিখিত আউটপুট তৈরি করবে

The correlation coefficient is: 1.0

একটি পান্ডাস ডেটাফ্রেমে দুটি সংখ্যাসূচক কলামের মধ্যে পারস্পরিক সম্পর্ক একটি পান্ডাস ডেটাফ্রেমে দুটি সংখ্যাসূচক কলামের মধ্যে পারস্পরিক সম্পর্ক

এখানে, পারস্পরিক সম্পর্ক সহগ হল 1.0 যা নিখুঁত পারস্পরিক সম্পর্ক নির্দেশ করে। সুতরাং, আমরা একটি সরল রেখা পাই কারণ সমস্ত বিন্দু একটি সরলরেখা বরাবর থাকে৷


  1. Python Pandas - কলাম হিসাবে মাল্টি ইনডেক্সের স্তর সহ একটি ডেটাফ্রেম তৈরি করুন

  2. পাইথন - একটি পান্ডাস ডেটাফ্রেমে স্পষ্টভাবে কলামের নাম দিন

  3. পাইথন - একটি পান্ডাস ডেটাফ্রেম থেকে একাধিক কলাম নির্বাচন করুন

  4. Python Pandas - একটি ডেটাফ্রেমে একাধিক ডেটা কলাম প্লট করবেন?