একটি অক্ষর এনকোডিং বাইটকে অক্ষরে রূপান্তর করার একটি পদ্ধতি। একটি HTML নথি যাচাই বা প্রদর্শন করতে, একটি প্রোগ্রামকে অবশ্যই একটি অক্ষর এনকোডিং চয়ন করতে হবে৷ HTML5 লেখকদের অক্ষর এনকোডিং সেট করার তিনটি উপায় রয়েছে:
HTTP কন্টেন্ট-টাইপ হেডার
আপনি যদি CGI বা অনুরূপ প্রোগ্রাম লিখতে থাকেন তবে আপনি যেকোন অক্ষর এনকোডিং সেট করতে HTTP সামগ্রী-টাইপ হেডার ব্যবহার করবেন।
print "Content-Type: text/html; charset=utf-8\r\n";
<মেটা> উপাদান
আপনি একটি অক্ষরসেট বৈশিষ্ট্য সহ একটি <মেটা> উপাদান ব্যবহার করতে পারেন যা HTML5 নথির প্রথম 512 বাইটের মধ্যে এনকোডিং নির্দিষ্ট করে৷
<meta charset="UTF-8">
ইউনিকোড বাইট অর্ডার মার্ক (BOM)
একটি বাইট অর্ডার মার্ক (BOM) একটি ডাটা স্ট্রিমের শুরুতে অক্ষর কোড U+FEFF নিয়ে গঠিত, যেখানে এটি প্রাথমিকভাবে অচিহ্নিত প্লেইনটেক্সট ফাইলগুলির বাইট অর্ডার এবং এনকোডিং ফর্ম সংজ্ঞায়িত একটি স্বাক্ষর হিসাবে ব্যবহার করা যেতে পারে।