ধরে নিন, আপনার কাছে একটি ডেটাফ্রেম আছে এবং প্রথম ডুপ্লিকেট সারিগুলি সরানোর ফলাফল হল,
Id বয়স0 1 123 4 134 5 145 6 126 2 137 7 168 3 149 9 1510 10 14
সমাধান
এটি সমাধান করার জন্য, আমরা নীচে দেওয়া পদক্ষেপগুলি অনুসরণ করব -
-
একটি ডেটাফ্রেম সংজ্ঞায়িত করুন
-
আইডি এবং বয়স কলামের ভিতরে ড্রপ_ডুপ্লিকেট ফাংশন প্রয়োগ করুন তারপর প্রাথমিক মানটি 'শেষ' হিসাবে রাখুন।
df.drop_duplicates(subset=['Id','Age'],keep='last')
-
ফলাফলটি একই ডেটাফ্রেমের মধ্যে সংরক্ষণ করুন এবং এটি প্রিন্ট করুন
উদাহরণ
আসুন আরও ভালভাবে বোঝার জন্য নীচের বাস্তবায়ন দেখি -
pddf =pd.DataFrame({'আইডি':[1,2,3,4,5,6,2,7,3,9,10], 'বয়স':[12,13, 14,13,14,12,13,16,14,15,14] })প্রিন্ট("ডেটাফ্রেম হল:\n",df)df =df.drop_duplicates(subset=['Id','Age'], keep='last')প্রিন্ট ("প্রথম ডুপ্লিকেট সারি অপসারণের পরে ডেটাফ্রেম:\n", df)আউটপুট
ডেটাফ্রেম হল:Id Age0 1 121 2 132 3 143 4 134 5 145 6 126 2 137 7 168 3 149 9 1510 10 14 ডাটাফ্রেম প্রথম ডুপ্লিকেট A4123041230 612530 সারি মুছে ফেলার পর 3 149 9 1510 10 14