
ডেটা বিশ্লেষণ এবং গণনা সম্পাদনের জন্য ডেটা পরিষ্কার করা অত্যন্ত গুরুত্বপূর্ণ এবং এটি ডেটা প্রস্তুতি এবং বিন্যাসের প্রথম ধাপ। ডেটা পরিষ্কার করার অর্থ হল অসঙ্গতি, ত্রুটি এবং অবাঞ্ছিত বিন্যাস অপসারণ করা। Microsoft Excel এর Power Query এবং Google Sheets এর REGEX ফাংশন উভয়ই উন্নত পরিষ্কারের জন্য শক্তিশালী। আসুন আমরা আপনাকে দেখাই কিভাবে Power Query এবং Google Sheets এর REGEX ফাংশনগুলি তুলনা করার সময় উন্নত ডেটা পরিষ্কারের জন্য ব্যবহার করতে হয়।
এক্সেলের পাওয়ার কোয়েরি
পাওয়ার কোয়েরি হল একটি অন্তর্নির্মিত এক্সেল বৈশিষ্ট্য যা ডেটা রূপান্তর এবং ডেটা পরিষ্কারের জন্য একটি ব্যবহারকারী-বান্ধব ইন্টারফেস প্রদান করে। এটি কোনো জটিল সূত্র ছাড়াই ডেটা পরিষ্কার করে এবং ফর্ম্যাট করে। পাওয়ার কোয়েরি বিভিন্ন উৎস থেকে ডেটা আমদানি করে এবং শক্তিশালী ডেটা সংযোগ প্রদান করে। জটিল ডেটা-ক্লিনিং কাজগুলি সম্পাদন করার জন্য এটিতে নমনীয় বৈশিষ্ট্য রয়েছে৷
Google পত্রকের REGEX ফাংশন
Google পত্রকের REGEX ফাংশনগুলি পাঠ্য ডেটার মধ্যে প্যাটার্নগুলি খুঁজে পেতে নিয়মিত অভিব্যক্তি ব্যবহার করে, এটি পাঠ্য এন্ট্রিগুলিকে পার্সিং, ফর্ম্যাটিং বা যাচাই করার জন্য আদর্শ করে তোলে৷
- REGEXREPLACE: রেগুলার এক্সপ্রেশনের সাথে মেলে এমন টেক্সটকে নির্দিষ্ট টেক্সট দিয়ে প্রতিস্থাপন করে।
- =REGEXREPLACE(টেক্সট, রেগুলার_এক্সপ্রেশন, প্রতিস্থাপন)
- REGEXMATCH: একটি টেক্সট স্ট্রিং একটি নির্দিষ্ট রেগুলার এক্সপ্রেশনের সাথে মেলে কিনা তা পরীক্ষা করে।
- =REGEXMATCH(টেক্সট, রেগুলার_এক্সপ্রেশন)
- REGEXEXTRACT: রেগুলার এক্সপ্রেশনের উপর ভিত্তি করে টেক্সট থেকে মিলিত সাবস্ট্রিং বের করে।
- =REGEXEXTRACT(টেক্সট, রেগুলার_এক্সপ্রেশন)
এই ফাংশনগুলি ডেটা ক্লিনিং, প্যাটার্ন রিকগনিশন এবং ডায়নামিক টেক্সট ম্যানিপুলেশনের জন্য উপযোগী৷
আসুন ভুল বিন্যাস, অবাঞ্ছিত অক্ষর, ত্রুটি, ফাঁকা স্থান এবং আরও অনেক কিছু সম্বলিত একটি কাঁচা ডেটাসেট বিবেচনা করি। এক্সেলের পাওয়ার ক্যোয়ারী এবং গুগল শীটের REGEX ফাংশনগুলি ব্যবহার করে আমরা একে অপরের সাথে তুলনা করার সময় আপনাকে উন্নত ডেটা পরিষ্কার দেখাব৷
অবাঞ্ছিত অক্ষর অপসারণ
বন্ধনী, ড্যাশ বা স্পেসগুলির মতো অবাঞ্ছিত অক্ষর ধারণকারী ফোন নম্বরগুলির একটি ডেটাসেট পরিষ্কার করুন৷
পাওয়ার কোয়েরি
- ডেটা পরিসর নির্বাচন করুন।
- ডেটা-এ যান ট্যাব>> সারণী/পরিসীমা থেকে নির্বাচন করুন .
- পাওয়ার কোয়েরি সম্পাদক পপ আপ হবে। কলাম নির্বাচন করুন। আমরা ফোন নম্বর নির্বাচন করেছি কলাম।
- রূপান্তর-এ যান ট্যাব>> মান প্রতিস্থাপন নির্বাচন করুন .
- মান প্রতিস্থাপন করুন ডায়ালগ বক্স পপ আপ হবে;
- খুঁজে নেওয়ার মান-এ বক্স:অবাঞ্ছিত অক্ষর লিখুন (, ), -, ) পৃথকভাবে।
- এর মধ্যে প্রতিস্থাপন করুন বক্স:এটি খালি রাখুন অথবা যদি আপনার সাথে প্রতিস্থাপন করার জন্য একটি মান থাকে তবে আপনি সেই মানটি সন্নিবেশ করতে পারেন।
- ঠিক আছে ক্লিক করুন .

- বন্ধ করুন এবং লোড করুন নির্বাচন করুন৷ পরিষ্কার করা ডেটা এক্সেলে ফিরিয়ে আনতে।

Google পত্রকের REGEXREPLACE ফাংশন
আসুন রিগ্রেপ্লেস ফাংশন ব্যবহার করে Google পত্রকগুলিতে ফর্ম্যাটিং সহ ডেটা পরিষ্কার করি। সেল G2 এ নিম্নলিখিত সূত্রটি সন্নিবেশ করুন।
=ARRAYFORMULA(IF(LEN(REGEXREPLACE(D2:D6, "[^0-9]", ""))=10,
"(" & MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 1, 3) & ") " &
MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 4, 3) & "-" &
MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 7, 4),
"Invalid"))
এই সূত্রটি সমস্ত অ-সংখ্যাসূচক অক্ষর মুছে ফেলবে। তারপরে, পরিষ্কার করা নম্বরটিতে ঠিক 10টি সংখ্যা আছে কিনা তা পরীক্ষা করবে। এটি বৈধ হলে, এটিকে (XXX) XXX-XXXX হিসাবে ফর্ম্যাট করুন৷; অন্যথায়, এটি "অবৈধ" ফেরত দেয়।

Google পত্রকের রিগ্রেপ্লেস ফাংশন
আপনি অপ্রয়োজনীয় বিশেষ অক্ষর পরিষ্কার করতে নিম্নলিখিত সূত্র ব্যবহার করতে পারেন।
সূত্র:
=REGEXREPLACE(D2, "[^a-zA-Z0-9]", "")
এই [^a-zA-Z0-9] প্যাটার্ন এমন কোনো অক্ষরকে সরিয়ে দেয় যা একটি অক্ষর বা অঙ্ক নয়।
আপনি যদি রেগুলার এক্সপ্রেশনের সাথে পরিচিত হন তবে আপনি REGREPLACE ফাংশন ব্যবহার করতে পারেন, এটি একটি একক সূত্রের মধ্যে অক্ষর বা সংখ্যা ছাড়া যেকোনো অক্ষরকে সরিয়ে দেয়।

স্ট্যান্ডার্ডাইজিং টেক্সট কেস
ডেটাসেটে মিশ্র পাঠ থাকতে পারে; আপনি সমস্ত টেক্সট এন্ট্রিকে ছোট হাতের বা টাইটেল কেসে রূপান্তর করতে পারেন।
পাওয়ার কোয়েরি
ডেটা পরিসর নির্বাচন করে এবং ডেটা -এ নেভিগেট করে পাওয়ার কোয়েরি খুলুন ট্যাব>> সারণী/পরিসীমা থেকে নির্বাচন করুন .
- রূপান্তর করতে পাঠ্য সহ কলাম নির্বাচন করুন।
- রূপান্তর-এ যান ট্যাব>> প্রতিটি শব্দ বড় করা নির্বাচন করুন .

Google পত্রক সঠিক ফাংশন
Google পত্রক'-এ regex-এর মাধ্যমে বিশুদ্ধভাবে প্রতিটি শব্দকে বড় করার কোনো উপায় নেই, কারণ Google Sheets' REGEXREPLACE সরাসরি regex প্যাটার্ন বা প্রতিস্থাপনের মধ্যে UPPER এবং LOWER ফাংশন সমর্থন করে না। আপনি বহিরাগত ফাংশনগুলি ব্যবহার করতে পারেন যেমন PROPER, UPPER, বা LOWER৷
৷এই সূত্রটি নিশ্চিত করে যে প্রতিটি শব্দ ক্যাপিটাল করা হয়েছে এবং যেকোন নন-প্রথম অক্ষর ছোট হাতের অক্ষরে রূপান্তরিত হয়েছে।

ডেলিমিটার দ্বারা ডেটা বিভাজন
আপনি যেকোন মার্জ করা টেক্সট বা নামকে ডিলিমিটারের মাধ্যমে আলাদা কলামে বিভক্ত করতে পারেন। পাওয়ার কোয়েরি এবং Google পত্রকের REGEX ফাংশন ব্যবহার করে ডেটা পরিষ্কার করা যাক।
পাওয়ার কোয়েরি
ডেটা পরিসর নির্বাচন করে এবং ডেটা -এ নেভিগেট করে পাওয়ার কোয়েরি খুলুন ট্যাব>> সারণী/পরিসীমা থেকে নির্বাচন করুন .
- নাম সম্বলিত কলাম বেছে নিন।
- হোম এ যান৷ ট্যাব>> স্প্লিট কলাম থেকে> ডিলিমিটার দ্বারা নির্বাচন করুন .

- ডিলিমিটার দ্বারা বিভক্ত কলামে ডায়ালগ বক্স;
- এ নির্বাচন করুন এবং বিভেদক লিখুন: একটি স্পেস( ) বেছে নিন .
- ঠিক আছে ক্লিক করুন .

- ফলিত কলামগুলির নাম পরিবর্তন করে "প্রথম নাম" এবং "শেষ নাম" রাখুন৷

Google পত্রক REGEXEXTRACT ফাংশন
ডিলিমিটার দ্বারা ডেটা বিভক্ত করতে আপনি REGEXEXTRACT ফাংশন ব্যবহার করতে পারেন। আপনার নির্বাচিত কক্ষে নিম্নলিখিত সূত্রটি সন্নিবেশ করুন৷
৷=REGEXEXTRACT(E9, "^([^ ]+) (.+)$")
এই সূত্রটি শেষ নাম এবং প্রথম নাম দুটি কোষে আলাদা করে। এটি প্রয়োজন অনুযায়ী অতিরিক্ত কলাম ব্যবহার করে৷

কখন পাওয়ার কোয়েরি বনাম Google পত্রক REGEX ব্যবহার করবেন
পাওয়ার কোয়েরি মৌলিক থেকে উন্নত ডেটা পরিষ্কারের জন্য সবচেয়ে উপযোগী। এটি একটি ব্যবহারকারী-বান্ধব ইন্টারফেসের সাথে আরও বিস্তৃত, কাঠামোগত ডেটা রূপান্তরের জন্য আদর্শ। জটিল ডেটাসেট, স্ট্রাকচার্ড যোগদান এবং ডেটা মার্জ করার সময় এটি কার্যকর।
Google পত্রক REGEX ফাংশনগুলি দ্রুত পাঠ্য-ভিত্তিক ক্রিয়াকলাপ এবং পৃথক কোষের মধ্যে নির্দিষ্ট পাঠ্য নিষ্কাশনের জন্য উপযুক্ত। আপনি যদি রেগুলার এক্সপ্রেশন সিনট্যাক্সে স্বাচ্ছন্দ্যবোধ করেন তাহলে REGEX ফাংশনগুলি বিশেষভাবে সহায়ক৷
৷উপসংহার
পাওয়ার ক্যোয়ারী এবং Google পত্রকের REGEX ফাংশনগুলি ডেটা পরিষ্কারের জন্য পরিপূরক সরঞ্জাম সরবরাহ করে। পাওয়ার কোয়েরি এক্সেল ব্যবহারকারীদের জন্য আদর্শ, যাদের বড় ডেটাসেটে ব্যাচ ট্রান্সফর্মেশন প্রয়োজন, যখন Google শীট REGEX ফাংশনগুলি ছোট ডেটাসেটে পাঠ্য-ভিত্তিক ক্রিয়াকলাপের জন্য নমনীয়তা প্রদান করে। আপনি শক্তিশালী, সুবিন্যস্ত ডেটা পরিষ্কারের জন্য উভয়ই কার্যকরভাবে ব্যবহার করতে পারেন! উভয় টুল বোঝার মাধ্যমে, আপনি এক্সেল বা Google পত্রক যা-ই থাকুন না কেন বেশিরভাগ পরিষ্কারের কাজগুলি পরিচালনা করতে পারেন!
সমাধান সহ বিনামূল্যে উন্নত এক্সেল ব্যায়াম পান!