ডেটাফ্রেম হল একটি দ্বিমাত্রিক ডেটা স্ট্রাকচার, যেখানে ডেটা সারি এবং কলামের আকারে একটি সারণী বিন্যাসে সংরক্ষণ করা হয়।
এটি একটি SQL ডেটা টেবিল বা একটি এক্সেল শীট উপস্থাপনা হিসাবে কল্পনা করা যেতে পারে। এটি নিম্নলিখিত কনস্ট্রাক্টর -
ব্যবহার করে তৈরি করা যেতে পারেpd.Dataframe(data, index, columns, dtype, copy)
আসুন আমরা বুঝতে পারি কিভাবে সিরিজের অভিধান ব্যবহার করে একটি ডেটাফ্রেম তৈরি করা যায়।
-
সিরিজ হল 'পান্ডাস' লাইব্রেরিতে উপস্থিত একটি একমাত্রিক ডেটা স্ট্রাকচার।
-
অক্ষ লেবেলটি সম্মিলিতভাবে সূচক হিসাবে পরিচিত।
-
সিরিজ স্ট্রাকচার যেকোনো ধরনের ডেটা যেমন পূর্ণসংখ্যা, ফ্লোট, স্ট্রিং, পাইথন অবজেক্ট ইত্যাদি সংরক্ষণ করতে পারে।
আসুন একটি উদাহরণ দেখি -
উদাহরণ
import pandas as pd my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("The dataframe created from dictionary of series : ") print(my_df)
আউটপুট
The dataframe created from dictionary f series : ab mn a 1.0 56 b 2.0 78 c 3.0 13 d NaN 13
ব্যাখ্যা
-
প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সহজতার জন্য উপনাম নাম দেওয়া হয়৷
-
কী এবং মানের সমন্বয়ে অভিধানের মান তৈরি করা হয়, যেখানে একটি মান আসলে একটি সিরিজ ডেটা স্ট্রাকচার।
-
সিরিজের এই অভিধানটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে একটি প্যারামিটার হিসাবে পাস করা হয়
-
ডেটাফ্রেমটি তৈরি করা হয়েছে সিরিজের অভিধানকে প্যারামিটার হিসাবে পাস করে।
-
ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।
দ্রষ্টব্য − 'NaN' শব্দটি 'Not a Number'-কে বোঝায়, যার অর্থ নির্দিষ্ট [row,col] মানের কোনো বৈধ এন্ট্রি নেই।