এই নিবন্ধে আপনি রুবি প্যাক এবং আনপ্যাক পদ্ধতি সম্পর্কে শিখবেন!
কিন্তু কেন আমাদের এই পদ্ধতির প্রয়োজন?
বাইনারি ডেটা দিয়ে কাজ করার চেয়ে পাঠ্যের সাথে কাজ করা অনেক সহজ .
পাঠ্য আপনাকে ব্যবহার করতে দেয়:
- রেগুলার এক্সপ্রেশন
- পদ্ধতি যেমন
scan&match - gsub
কিন্তু আপনি যদি বাইনারি ডেটা নিয়ে কাজ করতে চান তবে কিছু অতিরিক্ত কাজ করতে হবে। এখানেই অ্যারে#প্যাক এবং স্ট্রিং#আনপ্যাক পদ্ধতিগুলি কার্যকর হয়৷
৷আমি আপনাকে কিছু উদাহরণ দেখাই, শুধুমাত্র একটি সাধারণ স্ট্রিং দিয়ে শুরু করে এবং তারপরে আরও আকর্ষণীয় জিনিসগুলিতে চলে যাই।
ASCII মানগুলিতে স্ট্রিং
এটি স্ট্রিং-এর প্রতিটি অক্ষরকে দশমিক মানের মধ্যে রূপান্তর করবে:
str = "AABBCC"
str.unpack("c*")
# [65, 65, 66, 66, 67, 67]
"c*" লক্ষ্য করুন unpack এর জন্য যুক্তি .
এটি একটি "ফরম্যাট স্ট্রিং" যা unpack বলে ডেটা দিয়ে কি করতে হবে। এই ক্ষেত্রে, c মানে একটি অক্ষর নিন এবং এটিকে একটি পূর্ণসংখ্যা মানতে রূপান্তর করুন (স্ট্রিং#অর্ড পদ্ধতিও এটি করে)।
তারকাচিহ্ন * শুধু বলে "সমস্ত ইনপুট ডেটার জন্য এই বিন্যাসটি পুনরাবৃত্তি করুন"৷
হেক্সকে স্ট্রিং-এ রূপান্তর করুন
H pack এর সাথে ব্যবহৃত পদ্ধতি আপনাকে স্ট্রিং রূপান্তরের জন্য একটি হেক্স নম্বর দেয়৷
উদাহরণ :
["414243"].pack("H*")
# "ABC"
"ABC".unpack("H*")
# ["414243"]
কিভাবে হেক্সকে পূর্ণসংখ্যাতে রূপান্তর করতে হয়
এই ফর্ম্যাট স্ট্রিংটি 4 বাইট ডেটা নেয় এবং একটি পূর্ণসংখ্যা প্রদান করে। একটি বিষয় লক্ষ্য করুন যে এই বাইটগুলি "লিটল-এন্ডিয়ান" ফর্ম্যাটে রয়েছে৷
৷উদাহরণ :
"\xff\x00\x00\x00".unpack("l").first
# 255
"\x90\xC0\xDD\x08".unpack("l").first
# 148750480
আমি first ব্যবহার করেছি এখানে কারণ unpack একটি অ্যারে প্রদান করে।
আনপ্যাক পদ্ধতির সাথে বাইনারি ফাইল পার্সিং
আপনি কিভাবে একটি EXE, PNG বা GZIP এর মত একটি বাইনারি ফাইল পড়বেন?
আপনি যদি এই ফাইলগুলিকে প্লেইন টেক্সটের মতো পড়েন, তাহলে আপনি এমন কিছু দেখতে পাবেন যা র্যান্ডম ডেটার মতো দেখাচ্ছে…

এটা এলোমেলো জিনিস নয়।
একটি নথিভুক্ত কাঠামো আছে এই ফাইল ফরম্যাটের অনেকের জন্য এবং unpack পদ্ধতি হল যা আপনি সেই ডেটা পড়তে এবং এটিকে দরকারী কিছুতে রূপান্তর করতে ব্যবহার করতে পারেন৷
এখানে একটি উদাহরণ :
binary_data = "\x05\x00\x68\x65\x6c\x6c\x6f"
length, message = binary_data.unpack("Sa*")
# [5, "hello"]
এই উদাহরণে, বাইনারি ডেটা (হেক্সাডেসিমেলে উপস্থাপিত, যা 1s এবং 0s এর চেয়ে অনেক বেশি কম্প্যাক্ট) এর একটি দুই-বাইট (16 বিট) দৈর্ঘ্যের ক্ষেত্র রয়েছে যা নিম্নলিখিত স্ট্রিংটির দৈর্ঘ্য ধারণ করে। তারপর স্ট্রিং নিজেই আছে।
বাইনারি ফাইল এবং বাইনারি নেটওয়ার্ক প্রোটোকলের জন্য একটি "দৈর্ঘ্য" ক্ষেত্র থাকা খুবই সাধারণ।
এটি পার্সারকে ঠিক কতগুলি বাইট পড়তে হবে তা বলে .
হ্যাঁ৷
৷আমি জানি এই উদাহরণে আমি এক ধাপে দৈর্ঘ্য এবং ডেটা উভয়ই পড়েছি, এটি কেবল জিনিসগুলি সহজ রাখার জন্য।
কিভাবে বিনডেটা রত্ন ব্যবহার করবেন
এছাড়াও বিন্দাতা রত্ন রয়েছে, যা আপনাকে বাইনারি স্ট্রাকচার পার্স করতে সাহায্য করার জন্য বিশেষভাবে তৈরি করা হয়েছে।
এখানে একটি উদাহরণ :
class BinaryString < BinData::Record endian :little uint16 :len string :name, :read_length => :len end
read_length লক্ষ্য করুন প্যারামিটার এটি বিন্দাতাকে ক্ষেত্র থেকে দৈর্ঘ্য বের করতে বলবে, তাই এটি আপনাকে অনেক কাজ বাঁচাবে 🙂
সুতরাং আপনি যদি কোনো বাইনারি বিন্যাসের জন্য একটি পার্সার লিখতে চান, এই ধাপগুলি হল:
- এই ফরম্যাটের জন্য স্পেসিফিকেশন খুঁজুন (যদি এটি সর্বজনীন না হয় তাহলে আপনাকে এটিকে রিভার্স-ইঞ্জিনিয়ার করতে হবে, যা সম্পূর্ণ বিষয় নিজস্ব)
- ফাইলের প্রতিটি বিভাগের জন্য একটি `bindata` ক্লাস লিখুন (আপনি সাধারণত মেটাডেটা সহ প্রথমে একটি শিরোনাম বিভাগ এবং তারপর একাধিক ডেটা বিভাগ পাবেন)
- ডেটা পড়ুন এবং আপনি যেভাবে চান তা প্রক্রিয়া করুন (উদাহরণস্বরূপ, একটি PNG তে আপনি ছবির রঙ পরিবর্তন করতে পারেন)
- লাভ!
আপনি যদি bindata এর সম্পূর্ণ উদাহরণ দেখতে চান অ্যাকশনে গিথুবে আমার পিএনজি পার্সারটি দেখুন৷
বেস64 এনকোডিং
এই ধরনের এনকোডিং আছে যাকে "Base64" বলা হয়। আপনি এটি একটি URL-এ আগে দেখে থাকতে পারেন৷
৷এরকম কিছু দেখাচ্ছে৷ :
U2VuZCByZWluZm9yY2VtZW50cw==
শেষে ডবল সমান হয় সাধারণত টেল-টেল চিহ্ন যে আপনি Base64 নিয়ে কাজ করছেন , যদিও কিছু ইনপুট এর ফলে সমান চিহ্নগুলি সেখানে নেই (এগুলি প্যাডিং হিসাবে ব্যবহৃত হয়)।
তাহলে আমি তোমাকে কেন বলছি...
নিজে নিজে জানার জন্য একটি দরকারী জিনিস হওয়া ছাড়াও?
ঠিক আছে, দেখা যাচ্ছে যে আপনি একটি স্ট্রিংকে Base64 এ রূপান্তর করতে পারেন pack ব্যবহার করে পদ্ধতি।
যেমন আপনি এখানে দেখতে পাচ্ছেন৷ :
def encode64(bin)
[bin].pack("m")
end
encode64 "abcd"
# "YWJjZA==\n"
প্রকৃতপক্ষে, এটি Base64-এ ব্যবহৃত সঠিক পদ্ধতি স্ট্যান্ডার্ড লাইব্রেরি থেকে মডিউল।
সারাংশ
এই পোস্টে, আপনি pack সম্পর্কে শিখেছেন &unpack পদ্ধতি, যা আপনাকে বাইনারি ডেটা নিয়ে কাজ করতে সাহায্য করে। আপনি বাইনারি ফাইল পার্স করতে, একটি স্ট্রিংকে ASCII মানগুলিতে রূপান্তর করতে এবং Base64 এনকোডিংয়ের জন্য এটি ব্যবহার করতে পারেন৷
শেয়ার এবং সাবস্ক্রাইব করতে ভুলবেন না তাই আপনি এই মত আরো ব্লগ পোস্ট উপভোগ করতে পারেন! 🙂