কম্পিউটার

পাইথন প্রোগ্রামের সাথে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন


এই টিউটোরিয়ালে, আমরা পান্ডা এর মত মডিউল ব্যবহার করে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন সম্পর্কে শিখতে যাচ্ছি এবং matplotlib পাইথনে . পাইথন ডেটা বিশ্লেষণ জিনিসগুলির জন্য একটি দুর্দান্ত ফিট। পান্ডা মডিউল ইনস্টল করুন এবং matplotlib নিম্নলিখিত কমান্ড ব্যবহার করে।

pip install pandas


pip install matplotlib

ইনস্টলেশন প্রক্রিয়া শেষ হওয়ার পরে আপনি একটি সফল বার্তা পাবেন। আমরা প্রথমে পান্ডা সম্পর্কে জানব এবং তারপর matplotlib দেখতে পাবেন .

পান্ডা

পান্ডাস হল পাইথনের একটি ওপেন সোর্স লাইব্রেরি যা ডেটা বিশ্লেষণের টুল সরবরাহ করে। আমরা পান্ডা থেকে কিছু দরকারী পদ্ধতি দেখতে যাচ্ছি তথ্য বিশ্লেষণের জন্য।

ডেটাফ্রেম তৈরি করা

একটি ডেটাফ্রেম তৈরি করতে আমাদের একাধিক সারি প্রয়োজন . আসুন দেখি কিভাবে এটা করতে হয়।

উদাহরণ

# importing the pands package
import pandas as pd
# creating rows
hafeez = ['Hafeez', 19]
aslan = ['Aslan', 21]
kareem = ['Kareem', 18]
# pass those Series to the DataFrame
# passing columns as well
data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age'])
# displaying the DataFrame
print(data_frame)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

Name Age
0 Hafeez 19
1 Aslan 21
2 Kareem 18

পান্ডা ব্যবহার করে ডেটা আমদানি করা

লিঙ্কে যান এবং CSV ডাউনলোড করুন ফাইল CSV-এ ডেটা একটি কমা(,) আলাদা করে সারিতে থাকবে। আসুন দেখি কিভাবে পান্ডা ব্যবহার করে ডেটা আমদানি ও ব্যবহার করতে হয় .

উদাহরণ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# displaying the first 5 rows using data.head() method
print(data.head())

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

পাইথন প্রোগ্রামের সাথে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন

শেপ ভেরিয়েবল ব্যবহার করে দেখা যাক কয়টি সারি এবং কলাম আছে।

উদাহরণ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.shape)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

(29, 16)

আমাদের describe() নামে একটি পদ্ধতি আছে যা NaN ব্যতীত বিভিন্ন পরিসংখ্যান গণনা করে . একবার দেখা যাক।

উদাহরণ

# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.describe())

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

পাইথন প্রোগ্রামের সাথে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন

ডেটা প্লটিং

আমাদের matplotlib প্যাকেজ আছে ডেটা ব্যবহার করে গ্রাফ তৈরি করতে। চলুন দেখি কিভাবে matplotlib ব্যবহার করে বিভিন্ন ধরনের গ্রাফ তৈরি করা যায় .

উদাহরণ

# importing the pyplot module to create graphs
import matplotlib.pyplot as plot
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# creating a histogram of Time period
data['Time period'].hist(bins = 10)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>

পাইথন প্রোগ্রামের সাথে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন

আমরা matplotlib ব্যবহার করে বিভিন্ন ধরনের গ্রাফ তৈরি করতে পারি প্যাকেজ।

উপসংহার

টিউটোরিয়াল সম্পর্কে আপনার কোন সন্দেহ থাকলে মন্তব্য বিভাগে উল্লেখ করুন।


  1. পাইথন ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন

  2. পাইথনে বিভিন্ন চার্ট সহ ডেটা ভিজ্যুয়ালাইজেশন?

  3. পাইথনে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন?

  4. পাইথনে অনুসন্ধানমূলক ডেটা বিশ্লেষণ