আমরা যদি বিভাগগুলির মধ্যে উপস্থিত ডেটা তুলনা করতে চাই তবে বক্স প্লটগুলি কার্যকর হয়৷ এটি এমন একটি উপায় যেখানে ডেটাসেটের ডেটা বন্টন কোয়ার্টাইলের সাহায্যে বোঝা যায়। এটি বাক্স থেকে প্রসারিত উল্লম্ব লাইন নিয়ে গঠিত। এই এক্সটেনশনগুলি হুইস্কার হিসাবে পরিচিত। উপরের এবং নিম্ন কোয়ার্টাইলের বাইরে ডেটা কীভাবে পরিবর্তিত হয় সে সম্পর্কে এই ফিসকারগুলি বলে। এই কারণে বক্স প্লটগুলি হুইকার প্লট নামেও পরিচিত। ডেটাতে বহিরাগতদের পৃথক পয়েন্ট হিসাবে প্লট করা হয়।
ভায়োলিন প্লট হল কার্নেল ডেনসিটি অনুমান (KDE) সহ বক্স প্লটের সংমিশ্রণ। ডেটা কীভাবে বিতরণ করা হয়েছে তা বিশ্লেষণ করা এবং বোঝা সহজ। বেহালার প্রশস্ত অংশ তথ্যের উচ্চ ঘনত্ব নির্দেশ করে। বেহালার সংকীর্ণ অংশ তথ্যের নিম্ন ঘনত্ব নির্দেশ করে।
একটি বক্সপ্লটের মধ্যে আন্তঃ-চতুর্থাংশ পরিসীমা এবং ডেটার উচ্চ ঘনত্বের অংশ প্রতিটি বিভাগে একই অঞ্চলের মধ্যে পড়ে৷
ভায়োলিনপ্লট ফাংশনের সিনট্যাক্স
seaborn.violinplot(x, y,data,…)
আসুন আমরা বুঝতে পারি কিভাবে একটি বেহালা প্লট ডেটা প্লট করতে ব্যবহার করা যেতে পারে −
উদাহরণ
pdimport seaborn হিসেবে pandas আমদানি করুন /প্রে>আউটপুট
ব্যাখ্যা
- প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷ ৷
- ইনপুট ডেটা হল 'iris_data' যা scikit learn লাইব্রেরি থেকে লোড করা হয়।
- এই ডেটা একটি ডেটাফ্রেমে সংরক্ষিত থাকে৷ ৷
- 'load_dataset' ফাংশনটি আইরিস ডেটা লোড করতে ব্যবহৃত হয়।
- 'ভায়োলিনপ্লট' ফাংশন ব্যবহার করে এই ডেটাটি ভিজ্যুয়ালাইজ করা হয়েছে।
- এখানে, ডেটাফ্রেম প্যারামিটার হিসাবে সরবরাহ করা হয়েছে।
- এছাড়া, x এবং y মান নির্দিষ্ট করা আছে।
- এই ডেটা কনসোলে প্রদর্শিত হয়৷ ৷