আমরা pandas.DataFrame.corr ব্যবহার করতে পারি NULL মান বাদ দিয়ে কলামের জোড়াভিত্তিক পারস্পরিক সম্পর্ক গণনা করতে। পারস্পরিক সম্পর্ক সহগ দুটি ভেরিয়েবলের মধ্যে রৈখিক সংযোগের শক্তি নির্দেশ করে। সহগ রেঞ্জ -1 এবং 1 এর মধ্যে।
একটি পান্ডাস ডেটাফ্রেমে দুটি সংখ্যাসূচক কলামের মধ্যে পারস্পরিক সম্পর্ক পেতে, আমরা নিম্নলিখিত পদক্ষেপগুলি নিতে পারি -
- চিত্রের আকার সেট করুন এবং সাবপ্লটের মধ্যে এবং চারপাশে প্যাডিং সামঞ্জস্য করুন।
- দ্বি-মাত্রিক, আকার-পরিবর্তনযোগ্য, সম্ভাব্য ভিন্ন ভিন্ন ট্যাবুলার ডেটার একটি পান্ডাস ডেটাফ্রেম তৈরি করুন৷
- দুটি কলামের মান তুলনা করুন এবং col1.corr(col2) ব্যবহার করে পারস্পরিক সম্পর্ক সহগ গণনা করুন।
- কনসোলে পারস্পরিক সম্পর্ক সহগ মুদ্রণ করুন।
- চিত্রটি প্রদর্শন করতে, শো() ব্যবহার করুন পদ্ধতি।
উদাহরণ
import pandas as pd from matplotlib import pyplot as plt plt.rcParams["figure.figsize"] = [7.00, 3.50] plt.rcParams["figure.autolayout"] = True df = pd.DataFrame({'lab': [1, 2, 3], 'value': [3, 4, 5]}) col1 = df['lab'] col2 = df['value'] plt.plot(col1, col2) print("The correlation coefficient is: ", col1.corr(col2)) plt.show()
আউটপুট
এটি নিম্নলিখিত আউটপুট তৈরি করবে
The correlation coefficient is: 1.0
এখানে, পারস্পরিক সম্পর্ক সহগ হল 1.0 যা নিখুঁত পারস্পরিক সম্পর্ক নির্দেশ করে। সুতরাং, আমরা একটি সরল রেখা পাই কারণ সমস্ত বিন্দু একটি সরলরেখা বরাবর থাকে৷