Scikit-learn, সাধারণত sklearn নামে পরিচিত পাইথনের একটি ওপেন-সোর্স লাইব্রেরি যা মেশিন লার্নিং অ্যালগরিদম বাস্তবায়নের উদ্দেশ্যে ব্যবহৃত হয়।
এর মধ্যে রয়েছে পাইথনে একটি শক্তিশালী, এবং স্থিতিশীল ইন্টারফেসের সাহায্যে শ্রেণিবিন্যাস, রিগ্রেশন, ক্লাস্টারিং, মাত্রা হ্রাস এবং আরও অনেক কিছু। এই লাইব্রেরিটি Numpy, SciPy এবং Matplotlib লাইব্রেরিতে নির্মিত।
ডেটা লোড করার একটি উদাহরণ দেখা যাক −
উদাহরণ
from sklearn.datasets import load_iris my_data = load_iris() X = my_data.data y = my_data.target feature_name = my_data.feature_names target_name = my_data.target_names print("Feature names are : ", feature_name) print("Target names are : ", target_name) print("\nFirst 8 rows of the dataset are : \n", X[:8])
আউটপুট
Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)'] Target names are : ['setosa' 'versicolor' 'virginica'] First 8 rows of the dataset are : [[5.1 3.5 1.4 0.2] [4.9 3. 1.4 0.2] [4.7 3.2 1.3 0.2] [4.6 3.1 1.5 0.2] [5. 3.6 1.4 0.2] [5.4 3.9 1.7 0.4] [4.6 3.4 1.4 0.3] [5. 3.4 1.5 0.2]]
ব্যাখ্যা
- প্রয়োজনীয় প্যাকেজগুলি আমদানি করা হয়৷ ৷
- এর জন্য প্রয়োজনীয় ডেটাসেটও পরিবেশে লোড করা হয়৷ ৷
- বৈশিষ্ট্য এবং লক্ষ্য মানগুলি ডেটাসেট থেকে আলাদা করা হয়েছে৷ ৷
- এই বৈশিষ্ট্যগুলি এবং লক্ষ্যগুলি কনসোলে মুদ্রিত হয়৷ ৷
- এছাড়াও, ডেটার নমুনা দেখতে, ডেটার প্রথম 8টি সারি কনসোলে প্রিন্ট করা হয়৷