কম্পিউটার

পাইথনে কন্টিনজেন্সি টেবিল


একটি কন্টিনজেন্সি টেবিল হল একটি সারণী যেখানে একটি ভেরিয়েবল সারি এবং অন্য একটি পরিবর্তনশীল কলামে বিতরণ দেখায়। এটি দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক অধ্যয়ন করতে ব্যবহৃত হয়। এটি একটি মাল্টিওয়ে টেবিল যা একটি ডেটাসেট বর্ণনা করে যেখানে প্রতিটি পর্যবেক্ষণ বিভিন্ন ভেরিয়েবলের প্রতিটির জন্য একটি বিভাগের অন্তর্গত। এছাড়াও এটি মূলত দুই বা ততোধিক শ্রেণীগত ভেরিয়েবলের মধ্যে গণনার একটি সংকলন। কন্টিনজেন্সি টেবিলগুলিকে ক্রসট্যাব বা দ্বিমুখী টেবিলও বলা হয়, যা পরিসংখ্যানে ব্যবহৃত হয় বিভিন্ন শ্রেণীগত ভেরিয়েবলের মধ্যে সম্পর্ককে সংক্ষিপ্ত করতে।

কন্টিনজেন্সি কোফিসিয়েন্ট হল অ্যাসোসিয়েশনের একটি সহগ যা বলে যে দুটি ভেরিয়েবল বা ডেটাসেট একে অপরের থেকে স্বাধীন বা নির্ভরশীল কিনা, এটি পিয়ারসনের সহগ নামেও পরিচিত

উদাহরণ

নীচের উদাহরণে আমরা বিশ্লেষণের জন্য আইরিস ফুলের ডেটা সেট নিই। এই ডেটা সেটটিতে আইরিসের তিনটি প্রজাতির প্রতিটি থেকে 50টি নমুনা রয়েছে (আইরিস সেটোসা, আইরিস ভার্জিনিকা এবং আইরিস ভার্সিকলার)। প্রতিটি নমুনা থেকে চারটি বৈশিষ্ট্য পরিমাপ করা হয়েছিল:সেপল এবং পাপড়ির দৈর্ঘ্য এবং প্রস্থ, সেন্টিমিটারে। আমরা এই বৈশিষ্ট্যগুলির উপর কন্টিনজেন্সি মডেল তৈরি করব যা শেষ পর্যন্ত একে অপরের থেকে প্রজাতিকে আলাদা করতে ব্যবহার করা হবে৷

ডেটাসেট পড়া

উদাহরণ

pddatainput হিসাবে npimport পান্ডা হিসাবে numpy আমদানি করুন =pd.read_csv("iris.csv")প্রিন্ট (datainput.head(5))

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয়:

 sepallengthcm sepalwidthcm petallenghcm petalwidthcm প্রেসেস 0.1 3.5 1.4 0.2 আইরিস-সেটোসা 1 4.9 3.0 1.4 0.2 আইআরআইএস-সেটোসা 3 4.6 3.1 1.5 0.2 আইআরআইএস-সেটোসা 4 5.0 3.6 1.4 0.2 আইরিস-সেটোসা  

ডেটার সাধারণ পরিসংখ্যান

এরপরে, আমরা describe() ব্যবহার করে ডেটার সাধারণ পরিসংখ্যান সংগ্রহ করি। IT কীভাবে ডেটা বিতরণ করা হয় তার গড় এবং বিভিন্ন চতুর্থাংশ সম্পর্কে ধারণা দেয়।

উদাহরণ

pddatainput =pd.read_csv("iris.csv")print(datainput.describe()) হিসেবে
numpy আমদানি করুন 

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয়:

 SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCmcount 150.000000 150.000000 150.000000 150.000000mean 5,843333 3,054000 3,758667 1.198667std 0,828066 0,433594 1,764420 0.763161min 4,300000 2,000000 1,000000 0,10000025% 5,100000 2,800000 1,600000 0,30000050% 5,800000 3,000000 4,350000 1,30000075% 6,400000 3,300000 5,100000 1.800000max 7,900000 4,400000 6,900000 2,500000 

ডেটা টাইপস

এরপর আমরা ডেটাফ্রেমের কলামের বিভিন্ন ধরনের ডেটা পর্যবেক্ষণ করি।

উদাহরণ

pddatainput হিসাবে npimport পান্ডা হিসাবে numpy আমদানি করুন =pd.read_csv("iris.csv")প্রিন্ট(datainput.dtypes)

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয়:

SepalLengthCm float64SepalWidthCm float64PetalLengthCm float64PetalWidthCm float64Species objectdtype:অবজেক্ট

কন্টিনজেন্সি টেবিল তৈরি করা হচ্ছে

এখন আমরা প্রতিটি প্রজাতির জন্য পাপড়ির প্রস্থ দেখানো কলামের জন্য একটি আকস্মিক টেবিল তৈরি করি। এর জন্য আমরা পান্ডায় উপলব্ধ ক্রসট্যাব ফাংশন ব্যবহার করি এবং ইনপুট হিসাবে এই টো কলামের নাম দিই।

উদাহরণ

pddatainput =pd.read_csv("iris.csv")width_species =pd.crosstab(datainput['PetalWidthCm'],datainput['Species'],margins =False)print(width)
npimport pandas হিসাবে numpy আমদানি করুন /প্রে> 

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয়:

প্রজাতি Iris-setosa Iris-versicolor Iris-virginicaPetalWidthCm0.1 6 0 00.2 28 0 00.3 7 0 01.0 0 7 01.1 0 3 01.2 0 5 01.8 0. 91020 01.2 0 5 01.8 0 161020. 

প্রাক>

মাল্টি-ভেরিয়েট কন্টিনজেন্সি টেবিল

এই ক্ষেত্রে আমরা কন্টিনজেন্সি টেবিল তৈরি করতে দুইটির বেশি কলাম ব্যবহার করি। এখানে আমরা প্রতিটি প্রজাতির জন্য পাপড়ির দৈর্ঘ্য এবং পাপড়ি প্রস্থ উভয়ই ব্যবহার করি।

pddatainput =pd.read_csv("iris.csv")length_width_species =pd.crosstab([datainput.PetalLengthCm, datainput.PetalWidthCm],datainput.PetalWidthCm],datainput.PetalWidthCm],datainput.Species =F_Species, mart /প্রে>

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয়:

প্রজাতি Iris-setosa Iris-versicolor Iris-virginicaPetalLengthCm PetalWidthCm1.0 0.2 1 0 01.1 0.1 1 0 01.2 0.2 2 0 01.3 0.2 4 0 00.0...2 ...4 0 00.0...2 ... 0 16.6 2.1 0 0 16.7 2.0 0 0 12.2 0 0 16.9 2.3 0 0 1 

  1. matplotlib Python ব্যবহার করে X-অক্ষে সারিবদ্ধ করা টেবিল

  2. issuperset() পাইথনে

  3. পাইথনে আন্ডারস্কোর(_)

  4. পাইথনে কুইন