নিষ্কাশন একটি ডেটা গুদাম পরিবেশে অতিরিক্ত সাহায্যের জন্য একটি উৎস সিস্টেম থেকে তথ্য আহরণের পরিষেবা। এটি ETL প্রক্রিয়ার প্রথম পদ্ধতি। নিষ্কাশনের পরে, এই ডেটা পরিবর্তন করা যেতে পারে এবং ডেটা গুদামে লোড করা যেতে পারে। একটি ডেটা গুদামের জন্য উত্স সিস্টেমগুলি সাধারণত লেনদেন প্রক্রিয়াকরণ সফ্টওয়্যার। এটি একটি বিক্রয় বিশ্লেষণ ডেটা গুদামের জন্য উত্স সিস্টেমগুলি একটি অর্ডার এন্ট্রি সিস্টেম হতে পারে যা বর্তমান অর্ডার কার্যক্রমের সমস্ত ডেটা।
ডেটা নিষ্কাশন হল যেখানে ডেটা বিবেচনা করা হয় এবং একটি নির্দিষ্ট ডিজাইনে ডেটা উত্স (যেমন ডাটাবেস) থেকে প্রাসঙ্গিক তথ্য আনয়নের মাধ্যমে সরানো হয়। আরও ডেটা প্রসেসিং সম্পন্ন হয়েছে, যাতে মেটাডেটা এবং অন্যান্য ডেটা ইন্টিগ্রেশন সন্নিবেশ করা হয়; ডেটা ওয়ার্কফ্লোতে আরেকটি পদ্ধতি।
অসংগঠিত ডেটা উত্স এবং একাধিক ডেটা স্ট্রাকচার থেকে বেশিরভাগ ডেটা নিষ্কাশন প্রদর্শিত হয়। এই অসংগঠিত ডেটা টেবিল, সূচী এবং বিশ্লেষণ সহ যেকোনো আকারে হতে পারে।
একটি গুদামের ডেটা একাধিক উত্স থেকে উপস্থিত হতে পারে, একটি ডেটা গুদামের আগত রেকর্ডগুলি ব্যবহার করার জন্য তিনটি ভিন্ন কৌশল প্রয়োজন। এই প্রক্রিয়াগুলিকে এক্সট্রাকশন, ট্রান্সফরমেশন এবং লোডিং (ETL) হিসাবে উল্লেখ করা হয়।
ডেটা নিষ্কাশনের প্রক্রিয়ার মধ্যে রয়েছে অগোছালো ডেটা উত্স থেকে তথ্য পুনরুদ্ধার করা। ডেটা এক্সট্রাক্ট রিলেশনাল ডাটাবেসের স্টেজিং অপারেশনে লোড করা হয়। তাই নিষ্কাশন যুক্তি ব্যবহার করা হয় এবং সোর্স সিস্টেমকে সফ্টওয়্যার প্রোগ্রামিং ইন্টারফেস ব্যবহার করে ডেটা চাওয়া হয়।
ডেটা নিষ্কাশন সরঞ্জামের প্রকারগুলি
বিভিন্ন ধরণের ডেটা নিষ্কাশন সরঞ্জাম রয়েছে যা নিম্নরূপ -
ব্যাচ প্রসেসিং টুলস - লিগ্যাসি ডেটা নিষ্কাশন সরঞ্জামগুলি এই ডেটা ব্যাচে তৈরি করে, সাধারণত অফ-আওয়ারের সময় উচ্চ পরিমাণে মূল্যায়ন ক্ষমতা ব্যবহার করার প্রভাব হ্রাস করতে। একটি মাঝারিভাবে একজাতীয় ডেটা উত্স সহ একটি বন্ধ, অন-প্রিমিস সেটিং এর জন্য, একটি ব্যাচ নিষ্কাশন সমাধান সর্বোত্তম পদ্ধতি হতে পারে৷
ওপেন সোর্স টুলস − ওপেন সোর্স টুলগুলি বাজেট-সীমিত সফ্টওয়্যারের জন্য সবচেয়ে উপযুক্ত হতে পারে, এই ক্ষেত্রে সহায়ক কাঠামো এবং জ্ঞান বিবেচনা করে। বিভিন্ন বিক্রেতা ওপেন সোর্স হিসেবে তাদের পণ্যের সীমিত বা "হালকা" ব্যাখ্যা প্রদান করে।
ক্লাউড-ভিত্তিক টুলস - ক্লাউড-ভিত্তিক সরঞ্জাম হল বর্তমান প্রজন্মের নিষ্কাশন পণ্য। একটি ETL/ELT পদ্ধতির একটি উপাদান হিসাবে ডেটার রিয়েল-টাইম নিষ্কাশন এবং এই স্পেসে ক্লাউড-ভিত্তিক সরঞ্জামগুলি এক্সেল, ডেটা স্টোরেজ এবং বিশ্লেষণের জন্য সমস্ত ক্লাউডকে সমর্থন করার সুবিধা প্রদান করে। আজকের ক্লাউড বিক্রেতারা এই ক্ষেত্রগুলিকে টার্গেট করার জন্য এই সরঞ্জামগুলিকে নিরাপত্তা এবং চুক্তির বাইরেও নিয়ে যায়, এই দক্ষতা তৈরি করার জন্য প্রয়োজনীয়তা দূর করে৷