ডেটাফ্রেম হল একটি দ্বিমাত্রিক ডেটা স্ট্রাকচার, যেখানে ডেটা সারি এবং কলামের আকারে একটি সারণী বিন্যাসে সংরক্ষণ করা হয়। এটি একটি SQL ডেটা টেবিল বা একটি এক্সেল শীট উপস্থাপনা হিসাবে কল্পনা করা যেতে পারে।
এটি নিম্নলিখিত কনস্ট্রাক্টর -
ব্যবহার করে তৈরি করা যেতে পারেpd.Dataframe(data, index, columns, dtype, copy)
আমরা পূর্বে একটি পদ্ধতি দেখেছি যেখানে একটি সিরিজ ডেটা স্ট্রাকচার হিসাবে একটি নতুন কলাম তৈরি করা হয়েছিল। এটি মূল ডেটাফ্রেমে ইন্ডেক্স করা হয়েছিল এবং তাই ডেটাফ্রেমে যুক্ত করা হয়েছিল৷
৷আসুন আমরা ব্যবহার করি কিভাবে আমরা ডেটাফ্রেমের ইতিমধ্যে বর্তমান কলামগুলি ব্যবহার করে একটি কলাম তৈরি করতে পারি। এটি উপযোগী যখন আমাদের ইতিমধ্যে বর্তমান কলামগুলিতে কিছু গণনা করতে হবে এবং তাদের ফলাফল একটি নতুন কলামে সংরক্ষণ করতে হবে -
উদাহরণ
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' :pd.Series([56, 78, 32],index=['a','b','c'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) my_df['gh'] = my_df['ab'] + my_df['ef'] print("After adding column 0 and 2 to the dataframe, :") print(my_df)
আউটপুট
The dataframe is : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN After adding column 0 and 2 to the dataframe, : ab cd ef gh a 1.0 1 56.0 57.0 b 8.0 2 78.0 86.0 c 7.0 0 32.0 39.0 d NaN 9 NaN NaN
ব্যাখ্যা
-
প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সুবিধার জন্য উপনাম নাম দেওয়া হয়৷
-
কী এবং মানের সমন্বয়ে অভিধানের মান তৈরি করা হয়, যেখানে একটি মান আসলে একটি সিরিজ ডেটা স্ট্রাকচার।
-
এই ধরনের একাধিক অভিধান মান তৈরি করা হয়েছে।
-
এই অভিধানটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে প্যারামিটার হিসাবে পাস করা হয়
-
ডাটাফ্রেম তৈরি করা হয়েছে অভিধানটিকে প্যারামিটার হিসেবে পাস করার মাধ্যমে।
-
একটি নতুন কলাম ডেটাফ্রেমে ইন্ডেক্স করা হয় এবং এই নতুন কলামটি তৈরি করতে 0ম এবং 2য় কলাম যোগ করা হয়।
-
ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।
দ্রষ্টব্য − 'NaN' শব্দটি 'Not a Number'-কে বোঝায়, যার অর্থ নির্দিষ্ট [row,col] মানের কোনো বৈধ এন্ট্রি নেই।