ডেটা স্টেজিং হল একটি প্রধান প্রক্রিয়া যাতে নিম্নলিখিত সাবপ্রসেসগুলি অন্তর্ভুক্ত থাকে যা নিম্নরূপ -
এক্সট্রাক্ট করা হচ্ছে − নিষ্কাশন পদক্ষেপ হল ডেটা গুদাম পরিবেশে তথ্য পাওয়ার প্রথম ধাপ। এক্সট্র্যাক্ট করা উৎস ডেটা পড়া এবং শেখার সংজ্ঞায়িত করে এবং আরও কাজের জন্য ডেটা স্টেজিং এলাকায় প্রয়োজনীয় উপাদানগুলি অনুলিপি করে৷
পরিবর্তন − যেহেতু ডেটা স্টেজিং এরিয়াতে ডেটা বের করা হয়, তাই বিভিন্ন সম্ভাব্য রূপান্তর প্রক্রিয়া রয়েছে, নিম্নরূপ −
-
এটি ভুল বানান সংশোধন করে, ডোমেন দ্বন্দ্বের সমাধান করে (একটি শহরের নাম সহ যা একটি পোস্টাল কোডের সাথে অসামঞ্জস্যপূর্ণ), অনুপস্থিত ডেটা উপাদানগুলি নিয়ে কাজ করে এবং মানক বিন্যাসে নির্ধারণ করে ডেটা পরিষ্কার করতে পারে৷
-
এটি লিগ্যাসি রেকর্ড থেকে নির্বাচিত ক্ষেত্রগুলিকে পরিষ্কার করতে ব্যবহার করা যেতে পারে যা ডেটা গুদামের জন্য উপকারী নয়৷
-
এটি মূল মানগুলির সাথে হুবহু মিল রেখে বা নন-কী অ্যাট্রিবিউটগুলিতে অস্পষ্ট মিলগুলি প্রয়োগ করে, যেমন লিগ্যাসি সিস্টেম কোডগুলির টেক্সচুয়াল একই সন্ধান করার মাধ্যমে ডেটা উত্সগুলিতে যোগদান হতে পারে
-
এটি লিগ্যাসি সংজ্ঞায়িত কীগুলির উপর নির্ভরতা এড়াতে প্রতিটি ডাইমেনশন ডেটার জন্য সারোগেট কী তৈরি করতে পারে, যেখানে সারোগেট কী জেনারেশন প্রক্রিয়া ডাইমেনশন টেবিল এবং ফ্যাক্ট টেবিলের মধ্যে রেফারেন্সিয়াল অখণ্ডতা প্রয়োগ করে৷
-
এটি সাধারণ প্রশ্নের কাজকে বুস্ট করার জন্য সমষ্টি তৈরি করতে ব্যবহার করা যেতে পারে।
লোডিং এবং ইন্ডেক্সিং৷ − রূপান্তর পর্বের শেষে, ডেটা লোড ডেটা ইমেজের ডিজাইনে থাকে। ডেটা গুদাম পরিবেশে লোড করা সাধারণত মাত্রা টেবিল এবং ফ্যাক্ট টেবিলগুলিকে প্রতিফলিত করার রূপ নেয় এবং প্রতিটি প্রাপক ডেটা মার্টের আকার লোডিং সুবিধাগুলিতে এই টেবিলগুলিকে বৈশিষ্ট্যযুক্ত করে৷
গুণমান নিশ্চিতকরণ পরীক্ষা − যখন প্রতিটি ডেটা মার্ট লোড করা হয়েছে এবং সূচীকরণ করা হয়েছে এবং উপযুক্ত সমষ্টি প্রদান করা হয়েছে, বিজ্ঞাপনের আগে চূড়ান্ত পদক্ষেপ হল গুণমান নিশ্চিত করা। নতুন লোড করা ডেটার সম্পূর্ণ সেটের উপর একটি ব্যাপক ব্যতিক্রম নথির কাজ করে গুণমানের নিশ্চয়তা পরীক্ষা করা যেতে পারে।
সমস্ত রিপোর্টিং উপাদান উপস্থিত থাকা উচিত, এবং সমস্ত গণনা এবং মোট পর্যাপ্ত হওয়া উচিত। সমস্ত রিপোর্ট করা মান একই মানগুলির সময় ক্রম অনুসারে নির্ভরযোগ্য হওয়া উচিত যা তাদের পূর্বাভাস দেয়। ব্যতিক্রম নথিটি ডেটা মার্টের শেষ-ব্যবহারকারীর নথি লেখার সুবিধা দিয়ে তৈরি করা হয়েছে৷
রিলিজ/প্রকাশনা − যখন প্রতিটি ডেটা মার্ট বর্তমানে লোড করা হয়েছে এবং গুণমান নিশ্চিত করা হয়েছে, ব্যবহারকারী সম্প্রদায়কে জানানো উচিত যে নতুন রেকর্ড প্রস্তুত। প্রকাশনা মৌলিক মাত্রা এবং নতুন অনুমান যা পরিমাপিত বা গণনাকৃত তথ্যে প্রবর্তিত হয়েছে তাতে উপস্থিত হওয়া যেকোনো পরিবর্তনের প্রকৃতিকেও সংযুক্ত করে।
কোয়েরি করা হচ্ছে − Querying হল একটি বিস্তৃত শব্দ যা একটি ডেটা মার্ট থেকে তথ্যের অনুরোধ করার সমস্ত ক্রিয়াকলাপকে অন্তর্ভুক্ত করে, যেমন শেষ-ব্যবহারকারীদের দ্বারা অ্যাডহক অনুসন্ধান, নথি লেখা, জটিল সিদ্ধান্ত সমর্থন অ্যাপ্লিকেশন, মডেলগুলির অনুরোধ এবং অত্যাধুনিক ডেটা মাইনিং৷