কম্পিউটার

Python - পান্ডাস ডেটাফ্রেমের র‌্যাঙ্কিং সারি


প্রদত্ত ডেটা ফ্রেমে প্রতিটি সারির র‍্যাঙ্কিং ধারণ করে এমন একটি কলাম যোগ করতে যা আমাদেরকে একটি ডেটা ফ্রেম সাজাতে এবং একটি নির্দিষ্ট উপাদানের র‍্যাঙ্ক নির্ধারণ করতে সাহায্য করবে, উদাহরণস্বরূপ −

আমাদের ডেটাফ্রেম

নাম খেলার সময় (ঘন্টায়) রেট
0 কল অফ ডিউটি 45 গড়ের চেয়ে ভালো
1 মোট ওভারডোজ 46 ভাল
2 GTA3 52 সেরা
3 বুলি 22 গড়

আউটপুট

নাম খেলার সময় (ঘন্টায়) রেট র‍্যাঙ্কিং
0 কল অফ ডিউটি 45 গড়ের চেয়ে ভালো 3.0
1 মোট ওভারডোজ 46 ভাল 2.0
2 GTA3 52 সেরা 1.0
3 বুলি 22 গড় 4.0

এখন, যেমন আপনি উপরের উদাহরণে দেখতে পাচ্ছেন, আমাদের র‌্যাঙ্কিং হল সম্পূর্ণ সংখ্যা কিন্তু এর পাশে একটি দশমিক আছে, যার মানে আমরা বাস্তব সংখ্যাগুলিতেও র‌্যাঙ্কিং করতে পারি, এবং এটি ঘটে যখন একাধিক উপাদান একই র‌্যাঙ্কে থাকে। এই ধরনের ক্ষেত্রে আমাদের র্যাঙ্কিং উপাদানের মধ্যে বিভক্ত করা হয় তুলনায় তথ্য ফ্রেম. তাই, তাদের পদমর্যাদা হিসাবে তাদের একটি বাস্তব সংখ্যা আছে।

এখন কিভাবে আমরা আমাদের ডেটা ফ্রেমে র‍্যাঙ্ক বরাদ্দ করব

আমাদের ডেটাফ্রেমের উপাদানগুলিতে র‌্যাঙ্ক নির্ধারণের জন্য, আমরা পান্ডাস লাইব্রেরির একটি অন্তর্নির্মিত ফাংশন ব্যবহার করি যা হল . .rank() ফাংশন আমরা সেই মানদণ্ডটি পাস করি যার ভিত্তিতে আমরা এতে উপাদানগুলিকে র‍্যাঙ্কিং করি এবং এই ফাংশনটি প্রতিটি সারিতে একটি নতুন কলাম প্রদান করে যেখানে র‍্যাঙ্কিং সংরক্ষণ করা হয়৷

উদাহরণ

.rank() ফাংশন ব্যবহারের জন্য কোড হল

import pandas as pd
games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'],
       'Play Time(in hours)' : ['45', '46', '52', '22'],
        'Rate' : ['Better than Average', 'Good', 'Best', 'Average']}
df = pd.DataFrame(games)
df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0)
print(df)# Hello World program in Python
   
print ("Hello World!");

আউটপুট

    Name Play Time(in hours)       Rate ranking
0  Call Of Duty   45     Better than Average 3.0
1  TotalOverdose  46     Good                2.0
2  GTA 3          52     Best                1.0
3   Bully        22      Average             4.0

উপরের কোডের ব্যাখ্যা

এই কোডে, প্রদত্ত ডেটা ফ্রেমে উপস্থিত প্রতিটি উপাদানকে র‌্যাঙ্ক করার জন্য আমরা কেবল পান্ডার লাইব্রেরির অন্তর্নির্মিত ফাংশন ব্যবহার করছি। আমরা ‘প্লে টাইম(ঘন্টাগুলিতে)’ কলাম দিয়ে উপাদানগুলিকে র‌্যাঙ্ক করার জন্য সেরা মানদণ্ড ব্যবহার করতে পারি।

এখন আমরা আমাদের ডেটা ফ্রেমে ‘র‍্যাঙ্কিং’ নামে একটি কলাম যোগ করি এবং আমাদের .rank() ব্যবহার করি। এতে ফাংশন করুন এবং কলামের নামটি পাস করুন যার জন্য আমাদের উপাদানগুলির র‌্যাঙ্কিং করতে হবে (এই ক্ষেত্রে, এটি প্লে টাইম (ঘন্টাগুলিতে) কলাম) এখন যখন আমাদের নতুন কলাম তৈরি হয় তখন আমরা আমাদের ডেটা ফ্রেম প্রিন্ট করি।

উপসংহার

এই টিউটোরিয়ালে, আমরা আমাদের ডেটা ফ্রেমের সারিগুলিকে র‍্যাঙ্ক করি এবং তারপরে পান্ডাস লাইব্রেরি এবং এর অন্তর্নির্মিত ফাংশনগুলি ব্যবহার করে আমাদের ডেটা প্রিন্ট করি। পান্ডা ডেটাফ্রেমের সারি র‍্যাঙ্কিং করা একটি সহজ প্রক্রিয়া, তবে আপনাকে উপরের পদ্ধতিটি সঠিকভাবে অনুসরণ করতে হবে।


  1. eval() ফাংশন - Python Pandas ব্যবহার করে সারিগুলির সমষ্টি মূল্যায়ন করুন

  2. Python Pandas - একটি ডেটাফ্রেম থেকে সারিগুলির একটি উপসেট নির্বাচন করুন

  3. Python Pandas - ডেটাফ্রেম থেকে মাল্টিইনডেক্স তৈরি করুন

  4. পাইথন - কিভাবে একটি পান্ডাস ডেটাফ্রেম থেকে নাল সারি ড্রপ করবেন