এই টিউটোরিয়ালে, আমরা পাইথন পান্ডাস লাইব্রেরি ব্যবহার করে ডেটা বিশ্লেষণ দেখতে যাচ্ছি। লাইব্রেরি পান্ডা C এ লেখা আছে . সুতরাং, আমরা গতি নিয়ে কোন সমস্যা পাই না। এটি তথ্য বিশ্লেষণের জন্য বিখ্যাত। আমাদের পান্ডায় দুই ধরনের ডেটা স্টোরেজ স্ট্রাকচার আছে। সেগুলি হল সিরিজ৷ এবং ডেটাফ্রেম . আসুন একে একে দেখি।
1. সিরিজ
সিরিজ কাস্টমাইজড সূচক এবং মান সহ একটি 1D অ্যারে। আমরা pandas.Series(data, index) ব্যবহার করে একটি সিরিজ অবজেক্ট তৈরি করতে পারি ক্লাস সিরিজ ডেটা হিসাবে পূর্ণসংখ্যা, তালিকা, অভিধান গ্রহণ করবে। আসুন কিছু উদাহরণ দেখি।
উদাহরণ
# importing the pandas library import pandas as pd # data data = [1, 2, 3] # creating Series object # Series automatically takes the default index series = pd.Series(data) print(series)
আউটপুট
আপনি যদি উপরের প্রোগ্রামটি চালান তবে আপনি নিম্নলিখিত ফলাফল পাবেন৷
0 1 1 2 2 3 dtype: int64
কিভাবে একটি কাস্টমাইজড সূচক আছে? উদাহরণ দেখুন।
উদাহরণ
# importing the pandas library import pandas as pd # data data = [1, 2, 3] # index index = ['a', 'b', 'c'] # creating Series object series = pd.Series(data, index) print(series)
আউটপুট
আপনি যদি উপরের প্রোগ্রামটি চালান তবে আপনি নিম্নলিখিত ফলাফল পাবেন৷
a 1 b 2 c 3 dtype: int64
যখন আমরা সিরিজ-কে অভিধান হিসেবে ডেটা দিই ক্লাস, তারপর এটি সূচক হিসাবে কী এবং প্রকৃত ডেটা হিসাবে মান নেয়। আসুন একটি উদাহরণ দেখি।
উদাহরণ
# importing the pandas library import pandas as pd # data data = {'a':97, 'b':98, 'c':99} # creating Series object series = pd.Series(data) print(series)
আউটপুট
আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷
a 97 b 98 c 99 dtype: int64
আমরা একটি সূচক ব্যবহার করে সিরিজ থেকে ডেটা অ্যাক্সেস করতে পারি। আসুন উদাহরণ দেখি।
উদাহরণ
# importing the pandas library import pandas as pd # data data = {'a':97, 'b':98, 'c':99} # creating Series object series = pd.Series(data) # accessing the data from the Series using indexes print(series['a'], series['b'], series['c'])
আউটপুট
আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷
৷97 98 99
2.পান্ডা
আমরা পান্ডায় সিরিজ ক্লাস কিভাবে ব্যবহার করতে হয়. চলুন দেখি কিভাবে ডেটাফ্রেম ব্যবহার করবেন ক্লাস ডেটাফ্রেম পান্ডাতে ডেটা স্ট্রাকচার ক্লাস যাতে সারি এবং কলাম থাকে।
আমরা ডেটাফ্রেম তৈরি করতে পারি তালিকা, অভিধান, সিরিজ, ব্যবহার করে বস্তু ইত্যাদি.., আসুন তালিকা ব্যবহার করে ডেটাফ্রেম তৈরি করি।
উদাহরণ
# importing the pandas library import pandas as pd # lists names = ['Tutorialspoint', 'Mohit', 'Sharma'] ages = [25, 32, 21] # creating a DataFrame data_frame = pd.DataFrame({'Name': names, 'Age': ages}) # printing the DataFrame print(data_frame)
আউটপুট
আপনি যদি উপরের প্রোগ্রামটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফল পাবেন৷
Name Age 0 Tutorialspoint 25 1 Mohit 32 2 Sharma 21
চলুন দেখি কিভাবে সিরিজ ব্যবহার করে ডেটা ফ্রেম অবজেক্ট তৈরি করা যায়।
উদাহরণ
# importing the pandas library import pandas as pd # Series _1 = pd.Series([1, 2, 3]) _2 = pd.Series([1, 4, 9]) _3 = pd.Series([1, 8, 27]) # creating a DataFrame data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3}) # printing the DataFrame print(data_frame)
আউটপুট
আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷
৷a b c 0 1 1 1 1 2 4 8 2 3 9 27
আমরা ডেটাফ্রেম থেকে ডেটা অ্যাক্সেস করতে পারি কলামের নাম ব্যবহার করে। আসুন একটি উদাহরণ দেখি।
উদাহরণ
# importing the pandas library import pandas as pd # Series _1 = pd.Series([1, 2, 3]) _2 = pd.Series([1, 4, 9]) _3 = pd.Series([1, 8, 27]) # creating a DataFrame data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3}) # accessing the entire column with name 'a' print(data_frame['a'])
আউটপুট
আপনি যদি উপরের কোডটি চালান, তাহলে আপনি নিম্নলিখিত ফলাফলগুলি পাবেন৷
৷0 1 1 2 2 3 Name: a, dtype: int64
উপসংহার
টিউটোরিয়ালটিতে আপনার কোন সন্দেহ থাকলে, মন্তব্য বিভাগে উল্লেখ করুন।