ক্যারেক্টার সাবস্ট্রিংগুলিকে 'সাবস্ট্র' পদ্ধতি ব্যবহার করে টেনসরফ্লো-এর সাথে ব্যবহার করা যেতে পারে যা টেনসরফ্লোর 'স্ট্রিং' মডিউলে উপস্থিত রয়েছে। তারপর এটি একটি Numpy অ্যারেতে রূপান্তরিত হয় এবং তারপর প্রদর্শিত হয়৷
আরো পড়ুন: টেনসরফ্লো কী এবং নিউরাল নেটওয়ার্ক তৈরি করতে টেনসরফ্লো-এর সাথে কেরাস কীভাবে কাজ করে?
আমরা দেখতে পাব কিভাবে পাইথন ব্যবহার করে ইউনিকোড স্ট্রিংগুলিকে উপস্থাপন করা যায় এবং ইউনিকোড সমতুল্য ব্যবহার করে সেগুলিকে ম্যানিপুলেট করা যায়। প্রথমে, স্ট্যান্ডার্ড স্ট্রিং অপ্সের ইউনিকোড সমতুল্যের সাহায্যে স্ক্রিপ্ট সনাক্তকরণের উপর ভিত্তি করে ইউনিকোড স্ট্রিংগুলিকে টোকেনে আলাদা করুন৷
নিচের কোডটি চালানোর জন্য আমরা Google Colaboratory ব্যবহার করছি। Google Colab বা Colaboratory ব্রাউজারে Python কোড চালাতে সাহায্য করে এবং এর জন্য শূন্য কনফিগারেশন এবং GPUs (গ্রাফিক্যাল প্রসেসিং ইউনিট) তে বিনামূল্যে অ্যাক্সেস প্রয়োজন। জুপিটার নোটবুকের উপরে কোলাবোরেটরি তৈরি করা হয়েছে।
মুদ্রণ("ডিফল্ট ইউনিট হল বাইট")প্রিন্ট("যখন লেন 1 হয়, তখন একটি একক বাইট ফেরত দেওয়া হয়")tf.strings.substr(ধন্যবাদ, pos=7, len=1).numpy()print( "ইউনিটটি UTF8_CHAR" হিসাবে নির্দিষ্ট করা হয়েছে প্রাক>কোড ক্রেডিট:https://www.tensorflow.org/tutorials/load_data/unicode
আউটপুট
ডিফল্ট ইউনিট হল বাইট যখন লেন 1 হয়, তখন একটি একক বাইট ফেরত দেওয়া হয়এককটিকে UTF8_CHARI হিসাবে নির্দিষ্ট করা হয় এটি 4 বাইটস নেয়''ব্যাখ্যা
- tf.strings.substr অপারেশনটি "ইউনিট" প্যারামিটার নেয়।
- অতঃপর এটি "pos" এবং "len" প্যারামিটারে কোন ধরনের অফসেট থাকবে তা নির্ধারণ করতে এটি ব্যবহার করে।