একটি পান্ডাস ডেটাফ্রেম থেকে ডুপ্লিকেট মান অপসারণ করতে, drop_duplicates() পদ্ধতি ব্যবহার করুন। প্রথমে, ৩টি কলাম −
সহ একটি ডেটাফ্রেম তৈরি করুনdataFrame =pd.DataFrame({'Car':['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place':['দিল্লি', ' হায়দ্রাবাদ', 'চন্ডিগড়', 'দিল্লি', 'হায়দরাবাদ', 'মুম্বাই'], 'ইউনিটসসোল্ড':[৯৫, ৭০, ৮০, ৯৫, ৭০, ৯০]})
সদৃশ মানগুলি সরান -
dataFrame =dataFrame.drop_duplicates()
উদাহরণ
নিম্নলিখিত সম্পূর্ণ কোড -
pd# হিসাবে পান্ডা আমদানি করুন # DataFramedataFrame =pd.DataFrame({'Car':['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place' তৈরি করুন:['দিল্লি', 'হায়দ্রাবাদ', 'চন্ডিগড়', 'দিল্লি', 'হায়দ্রাবাদ', 'মুম্বাই'], 'ইউনিটসসোল্ড':[95, 70, 80, 95, 70, 90]})প্রিন্ট"ডেটাফ্রেম.. .\n", ডেটাফ্রেম# কলাম কারকাউন্টের ফ্রিকোয়েন্সি গণনা =ডেটাফ্রেম['কার']।মান_কাউন্টস()প্রিন্ট"\nকলামে গণনা করুন"প্রিন্ট(গণনা)# ডুপ্লিকেট ডেটাফ্রেম অপসারণ করা হচ্ছে =dataFrame.drop_duplicates()প্রিন্ট"\nডাটার পরে আপডেট করা হয়েছে সদৃশগুলি সরানো হচ্ছে...\n",ডুপ্লিকেটসকাউন্ট =dataFrame['Car'].value_counts()print"\nকলামে গণনা করুন"প্রিন্ট(গণনা)
আউটপুট
এটি নিম্নলিখিত আউটপুট −
তৈরি করবে <প্রে>ডেটাফ্রেম... কার প্লেস ইউনিট বিক্রি করা0 BMW দিল্লি 951 মার্সিডিজ হায়দ্রাবাদ 702 ল্যাম্বরগিনি চণ্ডীগড় 803 BMW দিল্লি 954 মার্সিডিজ হায়দ্রাবাদ 705 পোর্শে মুম্বাই 90 কলামে CarBMW 2Mercedes 2Porsche 1Lamborghini, 1NDUp4-এর পরে কারবিএমডব্লিউ 2মার্সিডিজ UnitsSold0 BMW দিল্লি 951 মার্সিডিজ হায়দ্রাবাদ 702 Lamborghini চণ্ডীগড় 805 Porsche Mumbai 90 Count in column CarBMW 1Porsche 1Lamborghini 1Mercedes 1নাম:গাড়ি, dtype:int64