কম্পিউটার

পান্ডাস পাইথনে ডেটা কীভাবে সংক্ষিপ্ত করা যায়?


এতে বিভিন্ন ফাংশন ব্যবহার করে ডেটা সম্পর্কে প্রচুর তথ্য পাওয়া যায়। কিন্তু আমরা যদি ডেটার সমস্ত তথ্য পেতে চাই, তাহলে 'describe' ফাংশনটি ব্যবহার করা যেতে পারে।

এই ফাংশনটি 'গণনা', 'মান', 'স্ট্যান্ডার্ড ডেভিয়েশন', 25 তম পার্সেন্টাইল, 50 তম পার্সেন্টাইল এবং 75 তম পার্সেন্টাইলের মতো তথ্য দেবে৷

উদাহরণ

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

আউটপুট

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

ব্যাখ্যা

  • প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সুবিধার জন্য উপনাম নাম দেওয়া হয়৷
  • কী এবং মানের সমন্বয়ে সিরিজের অভিধান তৈরি করা হয়, যেখানে একটি মান আসলে একটি সিরিজ ডেটা স্ট্রাকচার।
  • এই অভিধানটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে প্যারামিটার হিসাবে পাস করা হয়
  • ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।
  • আমরা ডেটা সম্পর্কে সমস্ত তথ্য পাওয়ার দিকে তাকিয়ে আছি।
  • ডেটাফ্রেমে 'বর্ণনা' ফাংশন বলা হয়।
  • বিবরণটি কনসোলে প্রিন্ট করা হয়েছে।

  1. পাইথনে সিবোর্ন লাইব্রেরিতে বার প্লট কীভাবে ব্যবহার করা যেতে পারে?

  2. পাইথনে 'seaborn' লাইব্রেরি ব্যবহার করে কীভাবে ডেটা দৃশ্যমানভাবে উপস্থাপন করা যেতে পারে?

  3. পাইথনের একটি মডেলের সাথে নন-লিনিয়ার ডেটা কীভাবে ফিট হতে পারে?

  4. আমি কীভাবে আমার ডেটা ব্যাকআপ করতে পারি?