ইউনিকোড ডেটা মডিউলটি ইউনিকোড অক্ষর ডেটাবেস ব্যবহার করে সমস্ত ইউনিকোড অক্ষর অ্যাক্সেস করতে ব্যবহৃত হয়। এই ডাটাবেসে, সমস্ত অক্ষরের অক্ষর বৈশিষ্ট্য রয়েছে।
এই মডিউল ব্যবহার করতে, আমাদের ইউনিকোডেটা আমদানি করতে হবে আমাদের কোডে মডিউল।
import unicodedata
ইউনিকোড ডেটাবেস পদ্ধতি
ইউনিকোডেটা মডিউলের কিছু মডিউল এখানে বর্ণনা করা হয়েছে।
মডিউল (unicodedata.lookup(নাম)) -
এই পদ্ধতিটি নামের অক্ষরগুলি সন্ধান করতে ব্যবহৃত হয়। নাম বৈধ হলে, এটি অক্ষর ফেরত দেওয়া উচিত. অন্যথায় এটি কী-এরর বাড়াবে।
মডিউল (unicodedata.name(chr[, default]))-
এই পদ্ধতিটি প্রদত্ত অক্ষরের নাম স্ট্রিং হিসাবে ফেরত দিতে ব্যবহৃত হয়। যদি ডিফল্ট মান দেওয়া হয়, এটি ডিফল্ট ফেরত দিতে পারে, যখন অক্ষরটি ডাটাবেসে উপস্থিত না থাকে, অন্যথায় এটি ValueError বাড়াবে৷
মডিউল (unicodedata.digit(chr[, default])) -
প্রদত্ত অক্ষরের পূর্ণসংখ্যা সংখ্যা ফেরাতে এই পদ্ধতিটি ব্যবহার করা হয়। যদি ডিফল্ট মান দেওয়া হয়, এটি ডিফল্ট ফেরত দিতে পারে, যখন অক্ষরটি ডাটাবেসে উপস্থিত না থাকে বা সঠিকভাবে না থাকে, অন্যথায় এটি ValueError বাড়াবে৷
মডিউল (unicodedata.category(chr)) -
এই পদ্ধতিটি অক্ষরের সাথে বরাদ্দ করা সাধারণ বিভাগ ফেরত দিতে ব্যবহৃত হয়। যেমন অক্ষরগুলির জন্য এটি 'L' ফেরত দেবে, বড় হাতের অক্ষরের জন্য এটি 'u' হবে, বন্ধনী খোলার জন্য, এটি Ps (বিরাম চিহ্ন শুরু) ইত্যাদি ফেরত দেবে।
মডিউল (unicodedata.mirrored(chr))-
অক্ষরের কোন মিরর করা অক্ষর আছে কিনা তা পরীক্ষা করার জন্য এই পদ্ধতিটি ব্যবহার করা হয়। কিছু অক্ষরের মিরর করা অক্ষর থাকে যেমন ‘(’ এবং ‘)’ ইত্যাদি। এটি মিরর করা অক্ষরের সাথে মেলে, এটি 1 ফেরত দেবে, অন্যথায় 0।
উদাহরণ কোড
import unicodedata as ud print(ud.lookup('ASTERISK')) print(ud.lookup('Latin Capital letter G')) #The Unicode name from the characters print(ud.name(u'x')) print(ud.name(u'°')) #The Unicode character to decimal and numerics print(ud.decimal(u'6')) print(ud.numeric(u'9')) #The Unicode character categoty print(ud.category(u'A')) print(ud.category(u'9')) print(ud.category(u'[')) #Punctuation Start #Unicode character to check whether mirrored or not print(ud.mirrored(u'A')) print(ud.mirrored(u'<'))
আউটপুট
* G LATIN SMALL LETTER X DEGREE SIGN 6 9.0 Lu Nd Ps 0 1