কম্পিউটার

পাইথন পান্ডা ব্যবহার করে ডেটা বিশ্লেষণ


এই টিউটোরিয়ালে, আমরা পাইথন পান্ডাস লাইব্রেরি ব্যবহার করে ডেটা বিশ্লেষণ দেখতে যাচ্ছি। লাইব্রেরি পান্ডা C এ লেখা আছে . সুতরাং, আমরা গতি নিয়ে কোন সমস্যা পাই না। এটি তথ্য বিশ্লেষণের জন্য বিখ্যাত। আমাদের পান্ডায় দুই ধরনের ডেটা স্টোরেজ স্ট্রাকচার আছে। সেগুলি হল সিরিজ৷ এবং ডেটাফ্রেম . আসুন একে একে দেখি।

1. সিরিজ

সিরিজ কাস্টমাইজড সূচক এবং মান সহ একটি 1D অ্যারে। আমরা pandas.Series(data, index) ব্যবহার করে একটি সিরিজ অবজেক্ট তৈরি করতে পারি ক্লাস সিরিজ ডেটা হিসাবে পূর্ণসংখ্যা, তালিকা, অভিধান গ্রহণ করবে। আসুন কিছু উদাহরণ দেখি।

উদাহরণ

# importing the pandas library
import pandas as pd
# data
data = [1, 2, 3]
# creating Series object
# Series automatically takes the default index
series = pd.Series(data)
print(series)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান তবে আপনি নিম্নলিখিত ফলাফল পাবেন৷

0 1
1 2
2 3
dtype: int64

কিভাবে একটি কাস্টমাইজড সূচক আছে? উদাহরণ দেখুন।

উদাহরণ

# importing the pandas library
import pandas as pd
# data
data = [1, 2, 3]
# index
index = ['a', 'b', 'c']
# creating Series object
series = pd.Series(data, index)
print(series)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান তবে আপনি নিম্নলিখিত ফলাফল পাবেন৷

a 1
b 2
c 3
dtype: int64

যখন আমরা সিরিজ-কে অভিধান হিসেবে ডেটা দিই ক্লাস, তারপর এটি সূচক হিসাবে কী এবং প্রকৃত ডেটা হিসাবে মান নেয়। আসুন একটি উদাহরণ দেখি।

উদাহরণ

# importing the pandas library
import pandas as pd
# data
data = {'a':97, 'b':98, 'c':99}
# creating Series object
series = pd.Series(data)
print(series)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

a 97
b 98
c 99
dtype: int64

আমরা একটি সূচক ব্যবহার করে সিরিজ থেকে ডেটা অ্যাক্সেস করতে পারি। আসুন উদাহরণ দেখি।

উদাহরণ

# importing the pandas library
import pandas as pd
# data
data = {'a':97, 'b':98, 'c':99}
# creating Series object
series = pd.Series(data)
# accessing the data from the Series using indexes
print(series['a'], series['b'], series['c'])

আউটপুট

আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷

97 98 99

2.পান্ডা

আমরা পান্ডায় সিরিজ ক্লাস কিভাবে ব্যবহার করতে হয়. চলুন দেখি কিভাবে ডেটাফ্রেম ব্যবহার করবেন ক্লাস ডেটাফ্রেম পান্ডাতে ডেটা স্ট্রাকচার ক্লাস যাতে সারি এবং কলাম থাকে।

আমরা ডেটাফ্রেম তৈরি করতে পারি তালিকা, অভিধান, সিরিজ, ব্যবহার করে বস্তু ইত্যাদি.., আসুন তালিকা ব্যবহার করে ডেটাফ্রেম তৈরি করি।

উদাহরণ

# importing the pandas library
import pandas as pd
# lists
names = ['Tutorialspoint', 'Mohit', 'Sharma']
ages = [25, 32, 21]
# creating a DataFrame
data_frame = pd.DataFrame({'Name': names, 'Age': ages})
# printing the DataFrame
print(data_frame)

আউটপুট

আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷

               Name    Age
0    Tutorialspoint    25
1             Mohit    32
2            Sharma    21

চলুন দেখি কিভাবে সিরিজ ব্যবহার করে ডেটা ফ্রেম অবজেক্ট তৈরি করা যায়।

উদাহরণ

# importing the pandas library
import pandas as pd
# Series
_1 = pd.Series([1, 2, 3])
_2 = pd.Series([1, 4, 9])
_3 = pd.Series([1, 8, 27])
# creating a DataFrame
data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3})
# printing the DataFrame
print(data_frame)

আউটপুট

আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷

   a  b  c
0  1  1  1
1  2  4  8
2  3  9  27

আমরা ডেটাফ্রেম থেকে ডেটা অ্যাক্সেস করতে পারি কলামের নাম ব্যবহার করে। আসুন একটি উদাহরণ দেখি।

উদাহরণ

# importing the pandas library
import pandas as pd
# Series
_1 = pd.Series([1, 2, 3])
_2 = pd.Series([1, 4, 9])
_3 = pd.Series([1, 8, 27])
# creating a DataFrame
data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3})
# accessing the entire column with name 'a'
print(data_frame['a'])

আউটপুট

আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷

0 1
1 2
2 3
Name: a, dtype: int64

উপসংহার

টিউটোরিয়ালটিতে আপনার কোন সন্দেহ থাকলে, মন্তব্য বিভাগে উল্লেখ করুন।


  1. পাইথন ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন

  2. পাইথনে ডেটা বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন?

  3. পাইথন ব্যবহার করে বেস64 ডেটা এনকোডিং

  4. পাইথনে অনুসন্ধানমূলক ডেটা বিশ্লেষণ