পাইথন লাইব্রেরির পরিসংখ্যান মডিউলটি ভগ্নাংশ এবং দশমিক প্রকার সহ সাংখ্যিক ডেটা প্রকারগুলি ব্যবহার করে পরিসংখ্যান সূত্র গণনা করার ফাংশন নিয়ে গঠিত।
এই নিবন্ধে বর্ণিত ফাংশনগুলি ব্যবহার করার জন্য নিম্নলিখিত আমদানি বিবৃতি প্রয়োজন৷
>>> from statistics import *
নিম্নলিখিত ফাংশন নমুনা ডেটার কেন্দ্রীয় প্রবণতা গণনা করে।
মানে() − এই ফাংশনটি ক্রম বা পুনরাবৃত্তির আকারে ডেটার গাণিতিক গড় গণনা করে৷
>>> from statistics import mean >>> numbers = [12,34,21,7,56] >>> mean(numbers) 26
নমুনা ডেটাতে দশমিক বস্তু বা ভগ্নাংশ বস্তু থাকতে পারে
>>> from decimal import Decimal >>> numbers = [12,34,21,Decimal('7'),56] >>> mean(numbers) Decimal('26') >>> from fractions import Fraction >>> numbers = [12,20.55,Fraction(4,5),21,56] >>> mean(numbers) 22.07
হারমোনিক_মান () − হারমোনিক গড় গণনা করা হয় নমুনা ডেটার উপাদানগুলির পারস্পরিক পাটিগণিত গড় গ্রহণ করে এবং তারপরে নিজেই গাণিতিক গড়কে গ্রহণ করে৷
নমুনা =[1,2,3,4,5]
পারস্পরিক অর্থ =[1/1, 1/2, 1/3, 1/4, 1/5] =2.28333333333
গড় =2.28333333333/5 =0. 45666666666666667
হারমোনিক গড় =1 / 45666666666666667 =2.189784218663093
>>> harmonic_mean([1,2,3,4,5]) 2.18978102189781
মিডিয়ান() − মধ্যক হল নমুনা ডেটার মধ্যম মান। মাঝামাঝি খুঁজে পেতে ডেটা স্বয়ংক্রিয়ভাবে আরোহী ক্রমে সাজানো হয়। যদি উপাদানের গণনা বিজোড় হয়, মধ্যমাটি মধ্যম মান। গণনাটি বিজোড় হলে, দুটি মধ্যবর্তী সংখ্যার গড় হল মধ্যক।
>>> median([2,5,4,8,6]) 5 >>> median([11,33,66,55,88,22]) 44.0
মোড() − এই ফাংশনটি নমুনার সবচেয়ে সাধারণ মান প্রদান করে। এই ফাংশনটি সাংখ্যিক বা অ-সাংখ্যিক ডেটাতে প্রয়োগ করা যেতে পারে।
>>> mode((4,7,8,4,9,7,12,4,8)) 4 >>> mode(['cc','aa','dd','cc','ff','cc']) 'cc'
কেন্দ্রীয় মান থেকে নমুনায় উপাদানগুলির বিচ্ছুরণের পরিমাপের সাথে নিম্নলিখিত ফাংশন ডিল করে।
ভ্যারিয়েন্স() − এই ফাংশনটি নমুনায় ডেটার পরিবর্তনশীলতা বা বিচ্ছুরণ প্রতিফলিত করে। বড় বৈচিত্র্য মানে ডেটা বিক্ষিপ্ত। ছোট পার্থক্য নির্দেশ করে যে ডেটা ঘনিষ্ঠভাবে ক্লাস্টার করা হয়েছে।
প্রকরণ খুঁজে বের করার পদ্ধতিটি নিচে দেওয়া হল
- নমুনার সমস্ত উপাদানের গাণিতিক গড় খুঁজুন।
- গড় এবং প্রতিটি উপাদানের মধ্যে পার্থক্যের বর্গ খুঁজুন এবং বর্গ যোগ করুন।
- ভেরিয়েন্স পেতে নমুনার আকার n হলে যোগফলকে n-1 দিয়ে ভাগ করুন
গাণিতিকভাবে, উপরের পদ্ধতিটি নিম্নলিখিত সূত্র দ্বারা উপস্থাপিত হয় -
$$s^2 =\frac{1}{n-1}\displaystyle\displaystyle\sum\limits_{i=1}^n(x_{i}-\overline{x})^2$$
সৌভাগ্যক্রমে variance() ফাংশন আপনার জন্য উপরের সূত্রের গণনা করে।
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> variance(num) 981.2111111111111
stdev() - এই ফাংশন নমুনায় ডেটার মানক বিচ্যুতি প্রদান করে। প্রমিত বিচ্যুতি হল প্রকরণের বর্গমূল।
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> stdev(num) 31.324289474960338