মানগুলির একটি পরিসরকে মানগুলির মান পরিসরে রূপান্তর করার প্রক্রিয়াটিকে স্বাভাবিককরণ বলা হয়। এই মানগুলি -1 থেকে +1 বা 0 থেকে 1-এর মধ্যে হতে পারে৷ বিয়োগ এবং ভাগের সাহায্যেও ডেটা স্বাভাবিক করা যেতে পারে৷
ইনপুট হিসাবে শেখার অ্যালগরিদমে দেওয়া ডেটা সামঞ্জস্যপূর্ণ এবং কাঠামোগত থাকা উচিত। মানগুলি কার্যকরভাবে ভবিষ্যদ্বাণী করার জন্য ইনপুট ডেটার সমস্ত বৈশিষ্ট্য একটি একক স্কেলে হওয়া উচিত। কিন্তু বাস্তব-বিশ্বে, ডেটা অসংগঠিত, এবং বেশিরভাগ সময় একই স্কেলে নয়।
এটি যখন স্বাভাবিককরণ ছবিতে আসে। এটি একটি সবচেয়ে গুরুত্বপূর্ণ তথ্য-প্রস্তুতি প্রক্রিয়া।
এটি একই স্কেলে পড়ার জন্য ইনপুট ডেটাসেটের কলামের মান পরিবর্তন করতে সাহায্য করে৷
স্বাভাবিককরণের প্রক্রিয়া চলাকালীন, মানগুলির পরিসর অ-বিকৃত হওয়া নিশ্চিত করা হয়।
দ্রষ্টব্য − মেশিন লার্নিং অ্যালগরিদমগুলিতে দেওয়া সমস্ত ইনপুট ডেটাসেটকে স্বাভাবিক করতে হবে না৷ সাধারণীকরণের প্রয়োজন তখনই যখন একটি ডেটাসেটের বৈশিষ্ট্যের মান সম্পূর্ণ ভিন্ন মাত্রায় থাকে।
বিভিন্ন ধরনের স্বাভাবিকীকরণ আছে −
- সর্বনিম্ন-সর্বোচ্চ স্বাভাবিককরণ
- Z স্বাভাবিকীকরণ
- ইউনিট ভেক্টর স্বাভাবিকীকরণ
আসুন আমরা বুঝতে পারি কিভাবে L1 স্বাভাবিককরণ কাজ করে।
সর্বনিম্ন পরম বিচ্যুতি হিসাবেও পরিচিত, এটি ডেটা পরিবর্তন করে যাতে পরম মানের সমষ্টি প্রতি সারিতে 1 হিসাবে থাকে।
আসুন দেখি কিভাবে Python −
-এ স্কিট লার্ন ব্যবহার করে L1 নরমালাইজেশন প্রয়োগ করা যায়উদাহরণ
sklearn import preprocessinginput_data =np.array( [[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.5.8, [0.5, -87.98, 45.62,]- 55.82]])data_normalized_l1 =preprocessing.normalize(input_data, norm='l1')print("\nL1 স্বাভাবিক করা ডেটা হল \n", data_normalized_l1)আউটপুট
l1 স্বাভাবিককৃত তথ্য [[0.26312604 0.24133757 -0.49553639] [0.16105417 0.0239141 -0.81503172] [0.00372856 -09389] [0.09204368 0.34082683]]]
ব্যাখ্যা
-
প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷
৷ -
Numpy লাইব্রেরি ব্যবহার করে ইনপুট ডেটা তৈরি করা হয়।
-
'প্রিপ্রসেসিং' ক্লাসে উপস্থিত 'নর্মালাইজ' ফাংশনটি ডেটা স্বাভাবিক করার জন্য ব্যবহার করা হয়।
-
স্বাভাবিককরণের ধরনটি 'l1' হিসাবে নির্দিষ্ট করা হয়েছে।
-
এইভাবে, অ্যারের যেকোনো ডেটা স্বাভাবিক হয়ে যায় এবং প্রতিটি সারির যোগফল হবে শুধুমাত্র 1।
-
এই স্বাভাবিক ডেটা কনসোলে প্রদর্শিত হয়৷
৷