টেক্সট স্টেগানোগ্রাফি হল গোপন টেক্সট মেসেজকে অন্য টেক্সটের মধ্যে লুকিয়ে রাখার একটি পদ্ধতি যা কভারিং মেসেজ হিসেবে বা প্রাথমিক গোপন মেসেজের সাথে যুক্ত একটি কভার মেসেজ তৈরি করে।
টেক্সট স্টেগানোগ্রাফিতে বিদ্যমান পাঠ্যের বিন্যাস রূপান্তর করা থেকে শুরু করে পাঠ্যের মধ্যে শব্দ পরিবর্তন, এলোমেলো অক্ষর ক্রম তৈরি করা বা পাঠযোগ্য পাঠ্য তৈরির জন্য প্রসঙ্গ-মুক্ত ব্যাকরণ ব্যবহার করা যা কিছু অন্তর্ভুক্ত করতে পারে।
ছবি, অডিও বা ভিডিও ফাইলে থাকা অপ্রয়োজনীয় ডেটার ঘাটতির কারণে টেক্সট স্টেগানোগ্রাফিকে সবচেয়ে জটিল বলে ধরা হয়। টেক্সট ডকুমেন্টের মেকানিজম যা শনাক্ত করতে পারে তার সাথে অভিন্ন, যখন ছবি সহ অন্য ধরনের নথিতে, ডকুমেন্টের গঠন যা শনাক্ত করতে পারে তার থেকে ভিন্ন।
সুতরাং, এই জাতীয় নথিতে, এটি সংশ্লিষ্ট আউটপুটে একটি বিখ্যাত পরিবর্তন না করেই নথির কাঠামোর পরিবর্তনগুলি শিখে তথ্য লুকিয়ে রাখতে পারে৷
অপ্রত্যাশিত পরিবর্তনগুলি একটি চিত্র বা একটি অডিও ফাইলে তৈরি করা যেতে পারে, তবে, পাঠ্য ফাইলগুলিতে, এমনকি একটি অতিরিক্ত অক্ষর বা বিরামচিহ্ন একটি নৈমিত্তিক পাঠকের দ্বারা উল্লেখযোগ্য হতে পারে। এটি টেক্সট ফাইল সংরক্ষণ করতে পারে কম মেমরির প্রয়োজন এবং এটির দ্রুততার পাশাপাশি সহজ যোগাযোগ এটিকে অন্যান্য ধরণের স্টেগানোগ্রাফিক পদ্ধতির চেয়ে পছন্দনীয় করে তোলে৷
টেক্সট স্টেগানোগ্রাফিকে সাধারণত তিন প্রকারে সংজ্ঞায়িত করা যেতে পারে যার মধ্যে রয়েছে ফরম্যাট ভিত্তিক র্যান্ডম এবং স্ট্যাটিস্টিক্যাল জেনারেশন, ভাষাগত পদ্ধতি যা নিম্নরূপ -
ফরম্যাট ভিত্তিক পদ্ধতি − বিন্যাস ভিত্তিক পদ্ধতিতে তথ্য গোপন করার জন্য পাঠ্যের বিন্যাসকে শারীরিকভাবে পরিবর্তন করা অন্তর্ভুক্ত। এই পদ্ধতির নির্দিষ্ট ত্রুটি আছে। যদি স্টেগো ফাইলটি ওয়ার্ড প্রসেসর দিয়ে খোলা হয়, তাহলে ভুল বানান এবং অতিরিক্ত সাদা স্থান চিহ্নিত করা হবে।
পরিবর্তিত ফন্টের আকার একজন মানুষের পাঠকের কাছে সন্দেহ জাগাতে পারে। অধিকন্তু, যদি প্রাথমিক প্লেইনটেক্সটটি অ্যাক্সেসযোগ্য হয়, তাহলে এই প্লেইনটেক্সটটিকে সন্দেহজনক স্টেগানোগ্রাফিক টেক্সটের সাথে তুলনা করলে টেক্সটটির ম্যানিপুলেটেড উপাদান তৈরি হতে পারে যা বেশ দৃশ্যমান।
এলোমেলো এবং পরিসংখ্যানগত প্রজন্ম − এলোমেলো এবং পরিসংখ্যানগত জেনারেশনে, এটি একটি পরিচিত প্লেইনটেক্সটের সাথে সঙ্গতিপূর্ণ প্রতিরোধ করা যেতে পারে, স্টেগানোগ্রাফাররা তাদের নিজস্ব কভার টেক্সট তৈরি করার অবলম্বন প্রদান করে। একটি পদ্ধতি হ'ল অক্ষরগুলির এলোমেলোভাবে দেখার ক্রম অনুসারে ডেটা গোপন করা।
অন্য পদ্ধতিতে, শব্দের দৈর্ঘ্য এবং অক্ষর ফ্রিকোয়েন্সিগুলির পরিসংখ্যানগত বৈশিষ্ট্যগুলি এমন শব্দ তৈরি করতে ব্যবহৃত হয় যা প্রদত্ত ভাষার প্রকৃত শব্দগুলির মতো একই পরিসংখ্যানগত বৈশিষ্ট্য ধারণ করবে৷
ভাষাগত স্টেগানোগ্রাফি − ভাষাগত স্টেগ্যানোগ্রাফি বিশেষত উত্পন্ন এবং পরিবর্তিত পাঠ্যের ভাষাগত বৈশিষ্ট্যগুলিকে বিবেচনা করে এবং কিছু ক্ষেত্রে, ভাষাগত প্রক্রিয়া ব্যবহার করে সেই স্থান যেখানে বার্তাগুলি গোপন থাকে৷
CFG গাছের কাঠামো তৈরি করতে পারে যা বিটগুলি লুকানোর জন্য ব্যবহার করা যেতে পারে যেখানে বাম শাখা '0' সংজ্ঞায়িত করে এবং ডান শাখা '1' এর সাথে সম্পর্কযুক্ত।
GNF-এ একটি ব্যাকরণও ব্যবহার করা যেতে পারে যেখানে একটি প্রোডাকশনের প্রথম পছন্দ বিট 0 সংজ্ঞায়িত করে এবং দ্বিতীয় পছন্দটি বিট 1 সংজ্ঞায়িত করে। এই পদ্ধতির কিছু অসুবিধা রয়েছে। প্রথমত, একটি ছোট ব্যাকরণ বিভিন্ন পাঠ্যের পুনরাবৃত্তির দিকে পরিচালিত করবে।
দ্বিতীয়ত, লেখাটি ব্যাকরণগতভাবে ত্রুটিহীন হলেও শব্দার্থিক স্থাপত্যের একটি ত্রুটি রয়েছে। ফলাফল হল বাক্যগুলির একটি স্ট্রিং যার একে অপরের সাথে কোন সম্পর্ক নেই৷