পাইথনে ইতিমধ্যে উপস্থিত কলামগুলি ব্যবহার করে কীভাবে একটি ডেটাফ্রেমে একটি নতুন কলাম তৈরি করা যেতে পারে?

ডেটাফ্রেম হল একটি দ্বিমাত্রিক ডেটা স্ট্রাকচার, যেখানে ডেটা সারি এবং কলামের আকারে একটি সারণী বিন্যাসে সংরক্ষণ করা হয়। এটি একটি SQL ডেটা টেবিল বা একটি এক্সেল শীট উপস্থাপনা হিসাবে কল্পনা করা যেতে পারে।

এটি নিম্নলিখিত কনস্ট্রাক্টর -

ব্যবহার করে তৈরি করা যেতে পারে

pd.Dataframe(data, index, columns, dtype, copy)

আমরা পূর্বে একটি পদ্ধতি দেখেছি যেখানে একটি সিরিজ ডেটা স্ট্রাকচার হিসাবে একটি নতুন কলাম তৈরি করা হয়েছিল। এটি মূল ডেটাফ্রেমে ইন্ডেক্স করা হয়েছিল এবং তাই ডেটাফ্রেমে যুক্ত করা হয়েছিল৷

৷

আসুন আমরা ব্যবহার করি কিভাবে আমরা ডেটাফ্রেমের ইতিমধ্যে বর্তমান কলামগুলি ব্যবহার করে একটি কলাম তৈরি করতে পারি। এটি উপযোগী যখন আমাদের ইতিমধ্যে বর্তমান কলামগুলিতে কিছু গণনা করতে হবে এবং তাদের ফলাফল একটি নতুন কলামে সংরক্ষণ করতে হবে -

উদাহরণ

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']),
'ef' :pd.Series([56, 78, 32],index=['a','b','c'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
my_df['gh'] = my_df['ab'] + my_df['ef']
print("After adding column 0 and 2 to the dataframe, :")
print(my_df)

আউটপুট

The dataframe is :
   ab   cd  ef
a  1.0  1  56.0
b  8.0  2  78.0
c  7.0  0  32.0
d NaN 9 NaN
After adding column 0 and 2 to the dataframe, :
   ab   cd  ef    gh
a  1.0  1   56.0  57.0
b  8.0  2   78.0  86.0
c  7.0  0   32.0  39.0
d  NaN  9   NaN   NaN

ব্যাখ্যা

প্রয়োজনীয় লাইব্রেরিগুলি আমদানি করা হয়, এবং ব্যবহারের সুবিধার জন্য উপনাম নাম দেওয়া হয়৷
কী এবং মানের সমন্বয়ে অভিধানের মান তৈরি করা হয়, যেখানে একটি মান আসলে একটি সিরিজ ডেটা স্ট্রাকচার।
এই ধরনের একাধিক অভিধান মান তৈরি করা হয়েছে।
এই অভিধানটি পরে 'পান্ডাস' লাইব্রেরিতে উপস্থিত 'ডেটাফ্রেম' ফাংশনে প্যারামিটার হিসাবে পাস করা হয়
ডাটাফ্রেম তৈরি করা হয়েছে অভিধানটিকে প্যারামিটার হিসেবে পাস করার মাধ্যমে।
একটি নতুন কলাম ডেটাফ্রেমে ইন্ডেক্স করা হয় এবং এই নতুন কলামটি তৈরি করতে 0ম এবং 2য় কলাম যোগ করা হয়।
ডেটাফ্রেমটি কনসোলে প্রিন্ট করা হয়।

দ্রষ্টব্য − 'NaN' শব্দটি 'Not a Number'-কে বোঝায়, যার অর্থ নির্দিষ্ট [row,col] মানের কোনো বৈধ এন্ট্রি নেই।