ডেটাফ্রেম হল একটি দ্বিমাত্রিক ডেটা স্ট্রাকচার, যেখানে ডেটা সারি এবং কলামের আকারে একটি সারণী বিন্যাসে সংরক্ষণ করা হয়।
এটি একটি SQL ডেটা টেবিল বা একটি এক্সেল শীট উপস্থাপনা হিসাবে কল্পনা করা যেতে পারে।
এটি নিম্নলিখিত কনস্ট্রাক্টর -
ব্যবহার করে তৈরি করা যেতে পারেpd.Dataframe(data, index, columns, dtype, copy)
'ডেটা', 'ইনডেক্স', 'কলাম', 'dtype' এবং 'কপি' বাধ্যতামূলক মান নয়।
অভিধানের একটি তালিকা ডেটাফ্রেমে ইনপুট হিসাবে প্রেরণ করা যেতে পারে। ডিফল্টরূপে অভিধানের কীগুলি কলামের নাম হিসাবে নেওয়া হয়। আসুন একটি উদাহরণ দেখি -
উদাহরণ
import pandas as pd my_data = [{'ab' : 34}, {'mn' : 56},{ 'gh' : 78}, {'wq' : 90},{'az' : 123},{'kl' : 45}] my_df = pd.DataFrame(my_data) print("The dataframe created from list of dictionary : ") print(my_df)
আউটপুট
The dataframe created from list of dictionary : ab az gh kl mn wq 0 34.0 NaN NaN NaN NaN NaN 1 NaN NaN NaN NaN 56.0 NaN 2 NaN NaN 78.0 NaN NaN NaN 3 NaN NaN NaN NaN NaN 90.0 4 NaN 123.0 NaN NaN NaN NaN 5 NaN NaN NaN 45.0 NaN NaN
ব্যাখ্যা
-
প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সুবিধার জন্য উপনাম নাম দেওয়া হয়৷
-
অভিধানের মানগুলির একটি তালিকা তৈরি করা হয়, যেখানে একটি অভিধানে একটি কী-মান জোড়া উপস্থিত থাকে৷
-
এইভাবে, একাধিক অভিধান তৈরি এবং একটি তালিকায় সংরক্ষণ করা হয়।
-
অভিধানের এই তালিকাটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে একটি প্যারামিটার হিসাবে পাস করা হয়
-
ডেটাফ্রেমটি অভিধানের মানগুলির তালিকাকে প্যারামিটার হিসাবে পাস করে তৈরি করা হয়৷
-
ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।
দ্রষ্টব্য − 'NaN' শব্দটি 'Not a Number'-কে বোঝায়, যার অর্থ নির্দিষ্ট [row,col] মানের কোনো বৈধ এন্ট্রি নেই।