স্ট্যান্ডার্ড ডেভিয়েশন ডেটাসেটের মানগুলি কীভাবে ছড়িয়ে পড়ে সে সম্পর্কে বলে। তারা আরও বলে যে ডেটাসেটের মানগুলি ডেটাসেটের কলামগুলির গাণিতিক গড় থেকে কত দূরে৷
কখনও কখনও, এটি একটি নির্দিষ্ট কলামের মানক বিচ্যুতি পেতে প্রয়োজন হতে পারে যা প্রকৃতিতে সংখ্যাসূচক। এখানেই std() ফাংশন ব্যবহার করা যেতে পারে। যে কলামটির গড় গণনা করা দরকার সেটি ডেটাফ্রেমে সূচীভুক্ত করা যেতে পারে এবং ডট অপারেটর ব্যবহার করে গড় ফাংশনটি কল করা যেতে পারে৷
স্ট্যান্ডার্ড বিচ্যুতি খুঁজে পেতে কলামের সূচকটিও পাস করা যেতে পারে।
আসুন আমরা একই −
এর একটি প্রদর্শন দেখিউদাহরণ
pdmy_data ={'নাম':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45) হিসেবে পান্ডা আমদানি করুন , 67, 89, 12, 23]), 'মান':pd.Series([8.79,23.24,31.98,78.56,90.20])}মুদ্রণ("ডেটাফ্রেম হল :")my_df =pd.DataFrame(my_data)প্রিন্ট (my_df)মুদ্রণ("কলাম 'বয়স'-এর আদর্শ বিচ্যুতি হল :")প্রিন্ট(my_df['বয়স'].std())মুদ্রণ("কলাম 'মান'-এর মানক বিচ্যুতি হল :")প্রিন্ট(my_df[ 'মান']।std())
আউটপুট
ডেটাফ্রেমটি হল :নামের বয়স মান0 টম 45 8.791 জেন 67 23.242 ভিন 89 31.983 ইভ 12 78.564 উইল 23 90.20 কলাম 'বয়স'-এর মানক বিচ্যুতি হল :31.4992067731.4992067370731.499206737070731.499206730730730731.4992067370.>ব্যাখ্যা
-
প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সহজতার জন্য উপনাম নাম দেওয়া হয়৷
-
কী এবং মান নিয়ে সিরিজের অভিধান তৈরি করা হয়, যেখানে একটি মান আসলে একটি সিরিজ ডেটা স্ট্রাকচার।
-
এই অভিধানটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে প্যারামিটার হিসাবে পাস করা হয়
-
ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।
-
আমরা একটি নির্দিষ্ট কলামের স্ট্যান্ডার্ড বিচ্যুতি গণনা করার দিকে নজর দিচ্ছি যেটিতে সাংখ্যিক মান রয়েছে৷
-
ডট অপারেটর ব্যবহার করে কলামের নাম উল্লেখ করে ডেটাফ্রেমে 'std' ফাংশনকে ডাকা হয়।
-
সাংখ্যিক কলামের আদর্শ বিচ্যুতি কনসোলে প্রিন্ট করা হয়।