ডেটা গুদামজাতকরণ একটি কৌশল যা মূলত ব্যবসাকে একটি অর্থপূর্ণ ব্যবসার অন্তর্দৃষ্টি দেওয়ার জন্য বিভিন্ন উত্স থেকে ডেটা সংগ্রহ এবং পরিচালনা করতে ব্যবহৃত হয়। একটি ডেটা গুদাম বিশেষভাবে পরিচালনার সিদ্ধান্তগুলিকে সমর্থন করার জন্য ডিজাইন করা হয়েছে৷
সহজ ভাষায়, একটি ডেটা গুদাম একটি ডাটাবেসকে সংজ্ঞায়িত করে যা একটি সংস্থার অপারেশনাল ডাটাবেস থেকে স্বাধীনভাবে রক্ষণাবেক্ষণ করা হয়। ডেটা গুদাম ব্যবস্থা একাধিক অ্যাপ্লিকেশন সিস্টেমের একীকরণ সক্ষম করে। তারা বিশ্লেষণের জন্য একত্রিত, ঐতিহাসিক তথ্যের একটি কঠিন প্ল্যাটফর্ম অফার করে ডেটা প্রক্রিয়াকরণ প্রদান করে।
ডেটা গুদামগুলি বহুমাত্রিক স্থানে ডেটাকে সাধারণীকরণ এবং কেন্দ্রীভূত করে। ডেটা গুদামগুলির নির্মাণে ডেটা পরিষ্কার করা, ডেটা ইন্টিগ্রেশন এবং ডেটা ট্রান্সফর্মেশন রয়েছে এবং ডেটা মাইনিংয়ের জন্য একটি গুরুত্বপূর্ণ প্রিপ্রসেসিং পদক্ষেপ হিসাবে দেখা যেতে পারে৷
এটি বিভিন্ন কণিকাগুলির বহুমাত্রিক ডেটার ইন্টারেক্টিভ বিশ্লেষণের জন্য অনলাইন বিশ্লেষণাত্মক প্রক্রিয়াকরণ (OLAP) সরঞ্জাম সরবরাহ করে, যা কার্যকর ডেটা সাধারণীকরণ এবং ডেটা মাইনিংকে সহজতর করে। অ্যাসোসিয়েশন, শ্রেণীবিভাগ, ভবিষ্যদ্বাণী এবং ক্লাস্টারিং সহ বিভিন্ন ডেটা মাইনিং ফাংশন রয়েছে যা বিমূর্ততার বিভিন্ন স্তরে জ্ঞানের ইন্টারেক্টিভ মাইনিং তৈরি করতে OLAP অপারেশনগুলির সাথে একীভূত করা যেতে পারে৷
তিনটি প্রধান ধরণের ডেটা গুদাম রয়েছে যা নিম্নরূপ -
এন্টারপ্রাইজ ডেটা ওয়ারহাউস (EDW) - এন্টারপ্রাইজ ডেটা গুদাম হল একটি কেন্দ্রীভূত গুদাম। এটি তথ্য সংগঠিত এবং প্রতিনিধিত্ব করার জন্য ব্যবহৃত হয়। EDW এর সাহায্যে, ব্যবহারকারী বিষয়ের উপর ভিত্তি করে ডেটা শ্রেণীবদ্ধ করতে পারে।
অপারেশনাল ডেটা স্টোর − অপারেশনাল ডেটা স্টোরে, ডেটা গুদামটি রিয়েল-টাইমে রিফ্রেশ করা হয়। সুতরাং, এটি সাধারণত রেকর্ড সংরক্ষণ, ইত্যাদি সহ রুটিন ক্রিয়াকলাপের জন্য ব্যবহৃত হয়।
ডেটা মার্ট - একটি ডেটা মার্টকে ডেটা গুদামের একটি উপসেট হিসাবে সংজ্ঞায়িত করা যেতে পারে। এটি বিক্রয়, অর্থ এবং আরও অনেক কিছুর জন্য ডিজাইন করা হয়েছে৷
৷ডেটা গুদামের বৈশিষ্ট্য
একটি ডেটা গুদামের বিভিন্ন বৈশিষ্ট্য রয়েছে যা নিম্নরূপ -
-
বিষয়-ভিত্তিক - একটি ডেটা গুদাম সিদ্ধান্ত গ্রহণকারীদের জন্য তথ্যের মডেলিং এবং বিশ্লেষণকে লক্ষ্য করে। এইভাবে, ডেটা গুদামগুলি সাধারণত সিদ্ধান্ত সমর্থন প্রক্রিয়ায় উপকারী নয় এমন তথ্য বাদ দিয়ে নির্দিষ্ট বিষয়ের সমস্যাগুলির একটি সহজ এবং সংক্ষিপ্ত দৃষ্টিভঙ্গি প্রদান করে৷
-
একত্রিত − যেহেতু ডেটা গুদামটি সাধারণত একাধিক ভিন্নধর্মী উত্স, যেমন রিলেশনাল ডাটাবেস, ফ্ল্যাট ফাইল এবং অনলাইন লেনদেন রেকর্ডগুলিকে একীভূত করে তৈরি করা হয়, তাই নামকরণের নিয়মাবলী, এনকোডিং প্রক্রিয়া, অ্যাট্রিবিউট পরিমাপগুলিতে ধারাবাহিকতা প্রদানের জন্য ডেটা পরিষ্কার এবং ডেটা ইন্টিগ্রেশন কৌশলগুলি ব্যবহার করা প্রয়োজন। , ইত্যাদি।
-
সময়-ভেরিয়েন্ট − ঐতিহাসিক দৃষ্টিকোণ থেকে ডেটা প্রদানের জন্য ডেটা সংরক্ষণ করা হয় (যেমন, বিগত 5-10 বছর)। ডেটা গুদামের প্রতিটি মূল প্রক্রিয়ার অন্তর্ভুক্ত, হয় অন্তর্নিহিতভাবে বা স্পষ্টভাবে, সময়ের একটি উপাদান৷
-
অ-উদ্বায়ী − একটি ডেটা গুদাম সর্বদা কার্যক্ষম পরিবেশে পাওয়া সফ্টওয়্যার ডেটা থেকে রূপান্তরিত ডেটার একটি শারীরিকভাবে স্বাধীন স্টোর। এই পৃথকীকরণের কারণে, একটি ডেটা গুদামের লেনদেন প্রক্রিয়াকরণ, পুনরুদ্ধার এবং একযোগে নিয়ন্ত্রণ কাঠামোর প্রয়োজন হয় না। এটি সাধারণত ডেটা অ্যাক্সেস করার জন্য শুধুমাত্র দুটি অপারেশন প্রয়োজন - ডেটার প্রাথমিক লোডিং এবং ডেটা অ্যাক্সেস।