কম্পিউটার

ডেটা ওয়ারহাউসের প্রক্রিয়াগুলি কী কী?


ডেটা স্টেজিং হল একটি প্রধান প্রক্রিয়া যাতে নিম্নলিখিত সাবপ্রসেসগুলি অন্তর্ভুক্ত থাকে যা নিম্নরূপ -

এক্সট্রাক্ট করা হচ্ছে − নিষ্কাশন পদক্ষেপ হল ডেটা গুদাম পরিবেশে তথ্য পাওয়ার প্রথম ধাপ। এক্সট্র্যাক্ট করা উৎস ডেটা পড়া এবং শেখার সংজ্ঞায়িত করে এবং আরও কাজের জন্য ডেটা স্টেজিং এলাকায় প্রয়োজনীয় উপাদানগুলি অনুলিপি করে৷

পরিবর্তন − যেহেতু ডেটা স্টেজিং এরিয়াতে ডেটা বের করা হয়, তাই বিভিন্ন সম্ভাব্য রূপান্তর প্রক্রিয়া রয়েছে, নিম্নরূপ −

  • এটি ভুল বানান সংশোধন করে, ডোমেন দ্বন্দ্বের সমাধান করে (একটি শহরের নাম সহ যা একটি পোস্টাল কোডের সাথে অসামঞ্জস্যপূর্ণ), অনুপস্থিত ডেটা উপাদানগুলি নিয়ে কাজ করে এবং মানক বিন্যাসে নির্ধারণ করে ডেটা পরিষ্কার করতে পারে৷

  • এটি লিগ্যাসি রেকর্ড থেকে নির্বাচিত ক্ষেত্রগুলিকে পরিষ্কার করতে ব্যবহার করা যেতে পারে যা ডেটা গুদামের জন্য উপকারী নয়৷

  • এটি মূল মানগুলির সাথে হুবহু মিল রেখে বা নন-কী অ্যাট্রিবিউটগুলিতে অস্পষ্ট মিলগুলি প্রয়োগ করে, যেমন লিগ্যাসি সিস্টেম কোডগুলির টেক্সচুয়াল একই সন্ধান করার মাধ্যমে ডেটা উত্সগুলিতে যোগদান হতে পারে

  • এটি লিগ্যাসি সংজ্ঞায়িত কীগুলির উপর নির্ভরতা এড়াতে প্রতিটি ডাইমেনশন ডেটার জন্য সারোগেট কী তৈরি করতে পারে, যেখানে সারোগেট কী জেনারেশন প্রক্রিয়া ডাইমেনশন টেবিল এবং ফ্যাক্ট টেবিলের মধ্যে রেফারেন্সিয়াল অখণ্ডতা প্রয়োগ করে৷

  • এটি সাধারণ প্রশ্নের কাজকে বুস্ট করার জন্য সমষ্টি তৈরি করতে ব্যবহার করা যেতে পারে।

লোডিং এবং ইন্ডেক্সিং৷ − রূপান্তর পর্বের শেষে, ডেটা লোড ডেটা ইমেজের ডিজাইনে থাকে। ডেটা গুদাম পরিবেশে লোড করা সাধারণত মাত্রা টেবিল এবং ফ্যাক্ট টেবিলগুলিকে প্রতিফলিত করার রূপ নেয় এবং প্রতিটি প্রাপক ডেটা মার্টের আকার লোডিং সুবিধাগুলিতে এই টেবিলগুলিকে বৈশিষ্ট্যযুক্ত করে৷

গুণমান নিশ্চিতকরণ পরীক্ষা − যখন প্রতিটি ডেটা মার্ট লোড করা হয়েছে এবং সূচীকরণ করা হয়েছে এবং উপযুক্ত সমষ্টি প্রদান করা হয়েছে, বিজ্ঞাপনের আগে চূড়ান্ত পদক্ষেপ হল গুণমান নিশ্চিত করা। নতুন লোড করা ডেটার সম্পূর্ণ সেটের উপর একটি ব্যাপক ব্যতিক্রম নথির কাজ করে গুণমানের নিশ্চয়তা পরীক্ষা করা যেতে পারে।

সমস্ত রিপোর্টিং উপাদান উপস্থিত থাকা উচিত, এবং সমস্ত গণনা এবং মোট পর্যাপ্ত হওয়া উচিত। সমস্ত রিপোর্ট করা মান একই মানগুলির সময় ক্রম অনুসারে নির্ভরযোগ্য হওয়া উচিত যা তাদের পূর্বাভাস দেয়। ব্যতিক্রম নথিটি ডেটা মার্টের শেষ-ব্যবহারকারীর নথি লেখার সুবিধা দিয়ে তৈরি করা হয়েছে৷

রিলিজ/প্রকাশনা − যখন প্রতিটি ডেটা মার্ট বর্তমানে লোড করা হয়েছে এবং গুণমান নিশ্চিত করা হয়েছে, ব্যবহারকারী সম্প্রদায়কে জানানো উচিত যে নতুন রেকর্ড প্রস্তুত। প্রকাশনা মৌলিক মাত্রা এবং নতুন অনুমান যা পরিমাপিত বা গণনাকৃত তথ্যে প্রবর্তিত হয়েছে তাতে উপস্থিত হওয়া যেকোনো পরিবর্তনের প্রকৃতিকেও সংযুক্ত করে।

কোয়েরি করা হচ্ছে − Querying হল একটি বিস্তৃত শব্দ যা একটি ডেটা মার্ট থেকে তথ্যের অনুরোধ করার সমস্ত ক্রিয়াকলাপকে অন্তর্ভুক্ত করে, যেমন শেষ-ব্যবহারকারীদের দ্বারা অ্যাডহক অনুসন্ধান, নথি লেখা, জটিল সিদ্ধান্ত সমর্থন অ্যাপ্লিকেশন, মডেলগুলির অনুরোধ এবং অত্যাধুনিক ডেটা মাইনিং৷


  1. SVM এর বৈশিষ্ট্য কি?

  2. ডেটা মাইনিংয়ের উপাদানগুলি কী কী?

  3. ডেটা গুদামের নিরাপত্তা সমস্যাগুলি কী কী?

  4. ডেটা গুদামের ডিজাইন কি?