কম্পিউটার

পাইথন - একটি পান্ডাস ডেটাফ্রেম থেকে ডুপ্লিকেট মানগুলি সরান


একটি পান্ডাস ডেটাফ্রেম থেকে ডুপ্লিকেট মান অপসারণ করতে, drop_duplicates() পদ্ধতি ব্যবহার করুন। প্রথমে, ৩টি কলাম −

সহ একটি ডেটাফ্রেম তৈরি করুন
dataFrame =pd.DataFrame({'Car':['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place':['দিল্লি', ' হায়দ্রাবাদ', 'চন্ডিগড়', 'দিল্লি', 'হায়দরাবাদ', 'মুম্বাই'], 'ইউনিটসসোল্ড':[৯৫, ৭০, ৮০, ৯৫, ৭০, ৯০]})

সদৃশ মানগুলি সরান -

dataFrame =dataFrame.drop_duplicates()

উদাহরণ

নিম্নলিখিত সম্পূর্ণ কোড -

pd# হিসাবে পান্ডা আমদানি করুন # DataFramedataFrame =pd.DataFrame({'Car':['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place' তৈরি করুন:['দিল্লি', 'হায়দ্রাবাদ', 'চন্ডিগড়', 'দিল্লি', 'হায়দ্রাবাদ', 'মুম্বাই'], 'ইউনিটসসোল্ড':[95, 70, 80, 95, 70, 90]})প্রিন্ট"ডেটাফ্রেম.. .\n", ডেটাফ্রেম# কলাম কারকাউন্টের ফ্রিকোয়েন্সি গণনা =ডেটাফ্রেম['কার']।মান_কাউন্টস()প্রিন্ট"\nকলামে গণনা করুন"প্রিন্ট(গণনা)# ডুপ্লিকেট ডেটাফ্রেম অপসারণ করা হচ্ছে =dataFrame.drop_duplicates()প্রিন্ট"\nডাটার পরে আপডেট করা হয়েছে সদৃশগুলি সরানো হচ্ছে...\n",ডুপ্লিকেটসকাউন্ট =dataFrame['Car'].value_counts()print"\nকলামে গণনা করুন"প্রিন্ট(গণনা)

আউটপুট

এটি নিম্নলিখিত আউটপুট −

তৈরি করবে <প্রে>ডেটাফ্রেম... কার প্লেস ইউনিট বিক্রি করা0 BMW দিল্লি 951 মার্সিডিজ হায়দ্রাবাদ 702 ল্যাম্বরগিনি চণ্ডীগড় 803 BMW দিল্লি 954 মার্সিডিজ হায়দ্রাবাদ 705 পোর্শে মুম্বাই 90 কলামে CarBMW 2Mercedes 2Porsche 1Lamborghini, 1NDUp4-এর পরে কারবিএমডব্লিউ 2মার্সিডিজ UnitsSold0 BMW দিল্লি 951 মার্সিডিজ হায়দ্রাবাদ 702 Lamborghini চণ্ডীগড় 805 Porsche Mumbai 90 Count in column CarBMW 1Porsche 1Lamborghini 1Mercedes 1নাম:গাড়ি, dtype:int64
  1. ফিলনা বা ইন্টারপোলেট ছাড়াই ডেটাফ্রেম থেকে NaN মানগুলি সরান (পাইথন ম্যাটপ্লটলিব)

  2. Python Pandas - ডুপ্লিকেট সূচক মান নির্দেশ করুন

  3. পাইথন পান্ডা - নন-নাল মানগুলিকে সামনে প্রচার করুন

  4. পাইথন পান্ডাস - অ-শূন্য মানগুলি পিছনের দিকে প্রচার করুন