ইনপুট মান হিসাবে 'tf.Tensor' ব্যবহার করে একই দৈর্ঘ্যের একাধিক স্ট্রিং এনকোড করা যেতে পারে। বিভিন্ন দৈর্ঘ্যের একাধিক স্ট্রিং এনকোড করার সময়, একটি tf.RaggedTensor একটি ইনপুট হিসাবে ব্যবহার করা উচিত। যদি একটি টেনসরে প্যাডেড/স্পার্স ফরম্যাটে একাধিক স্ট্রিং থাকে, তাহলে এটিকে tf.RaggedTensor-এ রূপান্তর করতে হবে। তারপর, এটিতে unicode_encode পদ্ধতিটি কল করা উচিত।
আরো পড়ুন: টেনসরফ্লো কী এবং নিউরাল নেটওয়ার্ক তৈরি করতে টেনসরফ্লো-এর সাথে কেরাস কীভাবে কাজ করে?
আসুন আমরা বুঝতে পারি কিভাবে পাইথন ব্যবহার করে ইউনিকোড স্ট্রিংগুলিকে উপস্থাপন করা যায় এবং ইউনিকোড সমতুল্য ব্যবহার করে সেগুলিকে ম্যানিপুলেট করা যায়। প্রথমত, আমরা স্ট্যান্ডার্ড স্ট্রিং অপ্সের ইউনিকোড সমতুল্যের সাহায্যে স্ক্রিপ্ট সনাক্তকরণের উপর ভিত্তি করে ইউনিকোড স্ট্রিংগুলিকে টোকেনে আলাদা করি৷
নিচের কোডটি চালানোর জন্য আমরা Google Colaboratory ব্যবহার করছি। Google Colab বা Colaboratory ব্রাউজারে Python কোড চালাতে সাহায্য করে এবং এর জন্য শূন্য কনফিগারেশন এবং GPUs (গ্রাফিক্যাল প্রসেসিং ইউনিট) তে বিনামূল্যে অ্যাক্সেস প্রয়োজন। জুপিটার নোটবুকের উপরে কোলাবোরেটরি তৈরি করা হয়েছে।
print("When encoding multiple strings of same lengths, tf.Tensor is used as input") tf.strings.unicode_encode([[99, 97, 116], [100, 111, 103], [ 99, 111, 119]],output_encoding='UTF-8') print("When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input:") tf.strings.unicode_encode(batch_chars_ragged, output_encoding='UTF-8') print("If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encode") tf.strings.unicode_encode( tf.RaggedTensor.from_sparse(batch_chars_sparse), output_encoding='UTF-8') tf.strings.unicode_encode( tf.RaggedTensor.from_tensor(batch_chars_padded, padding=-1), output_encoding='UTF-8')
কোড ক্রেডিট:https://www.tensorflow.org/tutorials/load_data/unicode
আউটপুট
When encoding multiple strings of same lengths, tf.Tensor is used as input When encoding multiple strings with varying length, a tf.RaggedTensor should be used as input: If there is a tensor with multiple strings in padded/sparse format, convert it to a tf.RaggedTensor before calling unicode_encodeকল করার আগে এটি একটি tf.RaggedTensor এ
ব্যাখ্যা
- একই দৈর্ঘ্যের একাধিক স্ট্রিং এনকোড করার সময়, tf. টেনসর ইনপুট হিসাবে ব্যবহার করা যেতে পারে।
- যখন বিভিন্ন দৈর্ঘ্যের একাধিক স্ট্রিং এনকোড করার সময়, একটি tf.RaggedTensor ইনপুট হিসাবে ব্যবহার করা যেতে পারে।
- যখন প্যাডেড/স্পার্স ফরম্যাটে একাধিক স্ট্রিং সহ একটি টেনসর থাকে, তখন এটিতে unicode_encode কল করার আগে এটিকে tf.RaggedTensor-এ রূপান্তর করতে হবে।