প্রদত্ত ডেটা ফ্রেমে প্রতিটি সারির র্যাঙ্কিং ধারণ করে এমন একটি কলাম যোগ করতে যা আমাদেরকে একটি ডেটা ফ্রেম সাজাতে এবং একটি নির্দিষ্ট উপাদানের র্যাঙ্ক নির্ধারণ করতে সাহায্য করবে, উদাহরণস্বরূপ −
আমাদের ডেটাফ্রেম
নাম খেলার সময় (ঘন্টায়) | রেট | |||
---|---|---|---|---|
0 | কল অফ ডিউটি | 45 | গড়ের চেয়ে ভালো | |
1 | মোট ওভারডোজ | 46 | ভাল | |
2 | GTA3 | 52 | সেরা | |
3 | বুলি | 22 | গড় |
আউটপুট
নাম খেলার সময় (ঘন্টায়) | রেট র্যাঙ্কিং | |||
---|---|---|---|---|
0 | কল অফ ডিউটি | 45 | গড়ের চেয়ে ভালো | 3.0 |
1 | মোট ওভারডোজ | 46 | ভাল | 2.0 |
2 | GTA3 | 52 | সেরা | 1.0 |
3 | বুলি | 22 | গড় | 4.0 |
এখন, যেমন আপনি উপরের উদাহরণে দেখতে পাচ্ছেন, আমাদের র্যাঙ্কিং হল সম্পূর্ণ সংখ্যা কিন্তু এর পাশে একটি দশমিক আছে, যার মানে আমরা বাস্তব সংখ্যাগুলিতেও র্যাঙ্কিং করতে পারি, এবং এটি ঘটে যখন একাধিক উপাদান একই র্যাঙ্কে থাকে। এই ধরনের ক্ষেত্রে আমাদের র্যাঙ্কিং উপাদানের মধ্যে বিভক্ত করা হয় তুলনায় তথ্য ফ্রেম. তাই, তাদের পদমর্যাদা হিসাবে তাদের একটি বাস্তব সংখ্যা আছে।
এখন কিভাবে আমরা আমাদের ডেটা ফ্রেমে র্যাঙ্ক বরাদ্দ করব
আমাদের ডেটাফ্রেমের উপাদানগুলিতে র্যাঙ্ক নির্ধারণের জন্য, আমরা পান্ডাস লাইব্রেরির একটি অন্তর্নির্মিত ফাংশন ব্যবহার করি যা হল . .rank() ফাংশন আমরা সেই মানদণ্ডটি পাস করি যার ভিত্তিতে আমরা এতে উপাদানগুলিকে র্যাঙ্কিং করি এবং এই ফাংশনটি প্রতিটি সারিতে একটি নতুন কলাম প্রদান করে যেখানে র্যাঙ্কিং সংরক্ষণ করা হয়৷
উদাহরণ
.rank() ফাংশন ব্যবহারের জন্য কোড হল
import pandas as pd games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'], 'Play Time(in hours)' : ['45', '46', '52', '22'], 'Rate' : ['Better than Average', 'Good', 'Best', 'Average']} df = pd.DataFrame(games) df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0) print(df)# Hello World program in Python print ("Hello World!");
আউটপুট
Name Play Time(in hours) Rate ranking 0 Call Of Duty 45 Better than Average 3.0 1 TotalOverdose 46 Good 2.0 2 GTA 3 52 Best 1.0 3 Bully 22 Average 4.0
উপরের কোডের ব্যাখ্যা
এই কোডে, প্রদত্ত ডেটা ফ্রেমে উপস্থিত প্রতিটি উপাদানকে র্যাঙ্ক করার জন্য আমরা কেবল পান্ডার লাইব্রেরির অন্তর্নির্মিত ফাংশন ব্যবহার করছি। আমরা ‘প্লে টাইম(ঘন্টাগুলিতে)’ কলাম দিয়ে উপাদানগুলিকে র্যাঙ্ক করার জন্য সেরা মানদণ্ড ব্যবহার করতে পারি।
এখন আমরা আমাদের ডেটা ফ্রেমে ‘র্যাঙ্কিং’ নামে একটি কলাম যোগ করি এবং আমাদের .rank() ব্যবহার করি। এতে ফাংশন করুন এবং কলামের নামটি পাস করুন যার জন্য আমাদের উপাদানগুলির র্যাঙ্কিং করতে হবে (এই ক্ষেত্রে, এটি প্লে টাইম (ঘন্টাগুলিতে) কলাম) এখন যখন আমাদের নতুন কলাম তৈরি হয় তখন আমরা আমাদের ডেটা ফ্রেম প্রিন্ট করি।
উপসংহার
এই টিউটোরিয়ালে, আমরা আমাদের ডেটা ফ্রেমের সারিগুলিকে র্যাঙ্ক করি এবং তারপরে পান্ডাস লাইব্রেরি এবং এর অন্তর্নির্মিত ফাংশনগুলি ব্যবহার করে আমাদের ডেটা প্রিন্ট করি। পান্ডা ডেটাফ্রেমের সারি র্যাঙ্কিং করা একটি সহজ প্রক্রিয়া, তবে আপনাকে উপরের পদ্ধতিটি সঠিকভাবে অনুসরণ করতে হবে।