ডেটা ভিজ্যুয়ালাইজ করা একটি গুরুত্বপূর্ণ পদক্ষেপ কারণ এটি আসলে সংখ্যাগুলি না দেখে এবং জটিল গণনাগুলি সম্পাদন না করে ডেটাতে কী চলছে তা বুঝতে সহায়তা করে। Seaborn হল একটি লাইব্রেরি যা ডেটা ভিজ্যুয়ালাইজ করতে সাহায্য করে। এটি কাস্টমাইজড থিম এবং একটি উচ্চ স্তরের ইন্টারফেসের সাথে আসে৷
সাধারণ স্ক্যাটার প্লট, হিস্টোগ্রাম, ইত্যাদি ব্যবহার করা যাবে না যখন যে ভেরিয়েবলগুলির সাথে কাজ করা দরকার সেগুলি স্বতন্ত্র প্রকৃতির হয়। এটি যখন শ্রেণীবদ্ধ স্ক্যাটারপ্লট ব্যবহার করা প্রয়োজন।
প্লট যেমন 'স্ট্রিপপ্লট', 'সোয়াম্পপ্লট' শ্রেণীগত ভেরিয়েবলের সাথে কাজ করতে ব্যবহৃত হয়। 'স্ট্রিপপ্লট' ফাংশনটি ব্যবহার করা হয় যখন কমপক্ষে একটি ভেরিয়েবল শ্রেণীবদ্ধ হয়। ডেটা একটি অক্ষ বরাবর একটি সাজানো পদ্ধতিতে উপস্থাপন করা হয়। কিন্তু অসুবিধা হল যে নির্দিষ্ট পয়েন্ট ওভারল্যাপ করা হয়। এখানে ভেরিয়েবলের মধ্যে ওভারল্যাপিং এড়াতে 'জিটার' প্যারামিটার ব্যবহার করতে হবে।
এটি ডেটাসেটে কিছু এলোমেলো শব্দ যোগ করে এবং শ্রেণীবদ্ধ অক্ষ বরাবর মানগুলির অবস্থানগুলিকে সামঞ্জস্য করে৷
স্ট্রিপপ্লট ফাংশনের সিনট্যাক্স
seaborn.stripplot(x, y,data, jitter = …)
আসুন দেখি কিভাবে একটি ডেটাসেটে শ্রেণীগত ভেরিয়েবল প্লট করতে 'জিটার' প্যারামিটার ব্যবহার করা যেতে পারে −
উদাহরণ
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('iris') sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True) plt.show()
আউটপুট
ব্যাখ্যা
- প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷ ৷
- ইনপুট ডেটা হল 'iris_data' যা scikit learn লাইব্রেরি থেকে লোড করা হয়।
- এই ডেটা একটি ডেটাফ্রেমে সংরক্ষিত থাকে৷ ৷
- 'load_dataset' ফাংশনটি আইরিস ডেটা লোড করতে ব্যবহৃত হয়।
- 'স্ট্রিপ্লপ্লট' ফাংশন ব্যবহার করে এই ডেটাটি ভিজ্যুয়ালাইজ করা হয়েছে।
- ডেটাফেমের মানগুলির ওভারল্যাপিং এড়াতে 'জিটার' নামে একটি অতিরিক্ত প্যারামিটার পাস করা হয়েছে৷
- এখানে, ডেটাফ্রেম প্যারামিটার হিসাবে সরবরাহ করা হয়েছে।
- এছাড়া, x এবং y মান নির্দিষ্ট করা আছে।
- এই ডেটা কনসোলে প্রদর্শিত হয়৷ ৷