দুটি ডেটাফ্রেমের মধ্যে সাধারণ সারি আনতে, concat() ব্যবহার করুন ফাংশন আসুন দুটি কলাম −
দিয়ে DataFrame1 তৈরি করিdataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
) দুটি কলাম −
দিয়ে DataFrame2 তৈরি করুনdataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
) concat() −
দিয়ে দুটি ডেটাফ্রেমের মধ্যে সাধারণ সারি খোঁজাdfRes = pd.concat([dataFrame1, dataFrame2])
সূচক রিসেট করুন -
dfRes = dfRes.reset_index(drop=True)
গ্রুপবাই কলাম −
dfGroup = dfRes.groupby(list(dfRes.columns))
গণনা গণনা করতে প্রতিটি সারির দৈর্ঘ্য পাওয়া। গণনা 1-এর বেশি হলে, এর মানে হবে সাধারণ সারি −
dfGroup.groups.values() তে k এর জন্যres = [k[0] for k in dfGroup.groups.values() if len(k) > 1]
উদাহরণ
নিম্নলিখিত কোড -
import pandas as pd
# Create DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)
print"DataFrame1 ...\n",dataFrame1
# Create DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
)
print"\nDataFrame2 ...\n",dataFrame2
# finding common rows between two DataFrames
dfRes = pd.concat([dataFrame1, dataFrame2])
# reset index
dfRes = dfRes.reset_index(drop=True)
# groupby columns
dfGroup = dfRes.groupby(list(dfRes.columns))
# length of each row to calculate the count
# if count is greater than 1, that would mean common rows
res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]
print"\nCommon rows...\n",dfRes.reindex(res)
আউটপুট
এটি নিম্নলিখিত আউটপুট −
তৈরি করবেDataFrame1 ... Car Reg_Price 0 BMW 1000 1 Lexus 1500 2 Audi 1100 3 Tesla 800 4 Bentley 1100 5 Jaguar 900 DataFrame2 ... Car Reg_Price 0 BMW 1200 1 Lexus 1500 2 Audi 1000 3 Tesla 800 4 Bentley 1100 5 Jaguar 1000 Common rows... Car Reg_Price 3 Tesla 800 1 Lexus 1500 4 Bentley 1100