'tf.Data' ডেটাসেটে ডেটা পরিবর্তন করে মডেল বিল্ডিং পাইপলাইন কাস্টমাইজ করতে সাহায্য করে যাতে সব ধরনের ডেটা সমানভাবে বিতরণ করা হয় (যদি সম্ভব হয়)।
আরো পড়ুন: টেনসরফ্লো কী এবং নিউরাল নেটওয়ার্ক তৈরি করতে টেনসরফ্লো-এর সাথে কেরাস কীভাবে কাজ করে?
আমরা কয়েক হাজার ফুলের ছবি সহ ফুলের ডেটাসেট ব্যবহার করব। এটিতে 5টি সাব-ডিরেক্টরি রয়েছে এবং প্রতিটি ক্লাসের জন্য একটি সাব-ডিরেক্টরি রয়েছে।
নিচের কোডটি চালানোর জন্য আমরা Google Colaboratory ব্যবহার করছি। Google Colab বা Colaboratory ব্রাউজারে Python কোড চালাতে সাহায্য করে এবং এর জন্য শূন্য কনফিগারেশন এবং GPUs (গ্রাফিক্যাল প্রসেসিং ইউনিট) তে বিনামূল্যে অ্যাক্সেস প্রয়োজন। জুপিটার নোটবুকের উপরে কোলাবোরেটরি তৈরি করা হয়েছে।
print("Defining customized input pipeline") list_ds = tf.data.Dataset.list_files(str(data_dir/'*/*'), shuffle=False) list_ds = list_ds.shuffle(image_count, reshuffle_each_iteration=False) for f in list_ds.take(5): print(f.numpy()) class_names = np.array(sorted([item.name for item in data_dir.glob('*') if item.name != "LICENSE.txt"])) print(class_names) print("The dataset is split into training and validation set") val_size = int(image_count * 0.2) train_ds = list_ds.skip(val_size) val_ds = list_ds.take(val_size) print("Length of each subset is displayed below") print(tf.data.experimental.cardinality(train_ds).numpy()) print(tf.data.experimental.cardinality(val_ds).numpy())
কোড ক্রেডিট:https://www.tensorflow.org/tutorials/load_data/images
আউটপুট
Defining customized input pipeline b'/root/.keras/datasets/flower_photos/dandelion/14306875733_61d71c64c0_n.jpg' b'/root/.keras/datasets/flower_photos/dandelion/8935477500_89f22cca03_n.jpg' b'/root/.keras/datasets/flower_photos/sunflowers/3001531316_efae24d37d_n.jpg' b'/root/.keras/datasets/flower_photos/daisy/7133935763_82b17c8e1b_n.jpg' b'/root/.keras/datasets/flower_photos/tulips/17844723633_da85357fe3.jpg' ['daisy' 'dandelion' 'roses' 'sunflowers' 'tulips'] The dataset is split into training and validation set Length of each subset is displayed below 2936 734
ব্যাখ্যা
- keras.preprocessing ইউটিলিটিগুলি হল ছবিগুলির একটি ডিরেক্টরি ব্যবহার করে একটি 'tf.data.Dataset' তৈরি করার একটি উপায়৷
- এতে আরও নিয়ন্ত্রণ পেতে, কাস্টমাইজড ইনপুট পাইপলাইন 'tf.data' ব্যবহার করে লেখা যেতে পারে।
- ফাইলের ট্রি স্ট্রাকচার একটি 'class_names' তালিকা কম্পাইল করতে ব্যবহার করা যেতে পারে।