কম্পিউটার

পাইথনে স্কিট-লার্ন লাইব্রেরি ব্যবহার করে বৈশিষ্ট্য ভেক্টর থেকে গড় মানগুলি কীভাবে দূর করবেন?


প্রি-প্রসেসিং ডেটা বলতে বোঝায় ডেটা পরিষ্কার করা, অবৈধ ডেটা অপসারণ করা, শব্দ করা, প্রাসঙ্গিক মান দিয়ে ডেটা প্রতিস্থাপন করা ইত্যাদি।

ডেটা প্রাক-প্রসেসিং মূলত সমস্ত ডেটা (যা বিভিন্ন সংস্থান বা একক সংস্থান থেকে সংগ্রহ করা হয়) একটি সাধারণ বিন্যাসে বা অভিন্ন ডেটাসেটে (ডেটার প্রকারের উপর নির্ভর করে) একত্রিত করার কাজকে বোঝায়। এক ধাপের আউটপুট পরবর্তী ধাপে ইনপুট হয়ে যায় এবং আরও অনেক কিছু।

নির্দিষ্ট ফলাফল পেতে ইনপুট ডেটা থেকে গড় মানগুলি সরাতে হতে পারে। আসুন আমরা বুঝতে পারি কিভাবে স্কিট-লার্ন লাইব্রেরি ব্যবহার করে এটি অর্জন করা যায়।

উদাহরণ

sklearn import preprocessinginput_data =np.array([[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.5.8, [0.5, -87.98, 45.62,]- 55.82]])print("গড় মান হল :", input_data.mean(axis=0))print("স্ট্যান্ডার্ড ডেভিয়েশন মান হল :", input_data.std(axis=0))data_scaled =preprocessing.scale(input_data)মুদ্রণ ("মান মান সরানো হয়েছে", data_scaled.mean(axis=0))print("স্ট্যান্ডার্ড বিচ্যুতি সরানো হয়েছে", data_scaled.std(axis=0))

আউটপুট

মান মান হল :[ 6.17 -12.8125 -39.8 ]মানক বিচ্যুতি মান হল :[18.4708067 45.03642047 50.30754615] গড় মান সরানো হয়েছে [-2.60208521e-2817e-2861e-39.8 Standation-28121e-2817e-2817. সরানো [1. 1. 1.]

ব্যাখ্যা

  • প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷

  • Numpy লাইব্রেরি ব্যবহার করে ইনপুট ডেটা তৈরি করা হয়।

  • গড় এবং আদর্শ বিচ্যুতি মান গণনা করা হয়।

  • এগুলি কনসোলে প্রদর্শিত হয়৷

  • 'ডেটা_স্কেলড' ফাংশনটি ডেটা থেকে গড় এবং মানক বিচ্যুতি মানগুলি সরাতে ব্যবহৃত হয়৷

  • এই সরানো গড় এবং মানক বিচ্যুতি ডেটা কনসোলে প্রদর্শিত হয়৷


  1. পাইথনে 'seaborn' লাইব্রেরি ব্যবহার করে কীভাবে ডেটা দৃশ্যমানভাবে উপস্থাপন করা যেতে পারে?

  2. পাইথনে স্কিট-লার্ন ব্যবহার করে একটি চিত্রের কনট্যুরগুলি কীভাবে খুঁজে পাবেন?

  3. পাইথনে স্কিট-লার্ন ব্যবহার করে একটি চিত্রের পিক্সেল মানগুলি কীভাবে দেখতে হয়?

  4. পাইথনে একটি চিত্রের রেজোলিউশন পেতে কীভাবে স্কিট-লার্ন লাইব্রেরি ব্যবহার করা যেতে পারে?