কম্পিউটার

ডেটা ট্রান্সফরমেশনের পরিষেবাগুলি কী কী?


ডেটা ট্রান্সফরমেশনে, ডেটা রূপান্তরিত হয় বা খনির জন্য প্রযোজ্য ফর্মগুলিতে লিঙ্ক করা হয়। ডেটা ট্রান্সফর্মেশনে নিম্নলিখিত −

থাকতে পারে
  • মসৃণ - এটি ডেটা থেকে শব্দ অপসারণ করতে কাজ করতে পারে। এই ধরনের কৌশলগুলির মধ্যে রয়েছে বিনিং, রিগ্রেশন এবং ক্লাস্টারিং।

  • সমষ্টি − একত্রীকরণে, যেখানে ডেটাতে সারাংশ বা একত্রীকরণ ক্রিয়াকলাপ প্রয়োগ করা হয়৷

  • সাধারণকরণ − সাধারণীকরণে, যেখানে নিম্ন-স্তরের বা "আদিম" (কাঁচা) ডেটা বৃহত্তর-স্তরের ধারণার মাধ্যমে পুনরুদ্ধার করা হয় ধারণা অনুক্রমের প্রয়োজনের মাধ্যমে৷

ডেটা ট্রান্সফরমেশনের বিভিন্ন পরিষেবা রয়েছে যা নিম্নরূপ -

একীকরণ − ইন্টিগ্রেশনের মধ্যে রয়েছে সারোগেট কী তৈরি করা, একটি স্কিম থেকে অন্য স্কিমে ম্যাপিং কী, এবং প্রোগ্রামগুলিকে সম্পূর্ণ বিবরণে ম্যাপ করা। এই রূপান্তরের পিছনে একটি মাস্টার কী লুকআপ টেবিলকে সমর্থন করার জন্য একটি অন্তর্নিহিত কর্তৃপক্ষ রয়েছে৷

ধীরে ধীরে পরিবর্তিত মাত্রা রক্ষণাবেক্ষণ − এটি পরিবর্তিত মান সনাক্ত করতে পারে এবং সারোগেট কী তৈরি করা একটি জটিল প্রক্রিয়া, তবে এটি স্থান-ওয়ার্প গণিত নয়। আপনি যদি একটি ডেটা স্টেজিং টুল কেনেন, এতে অন্তর্নির্মিত ধীরে ধীরে পরিবর্তিত মাত্রা পরিচালনা করার জন্য অ্যালগরিদম থাকা উচিত।

সাধারণকরণ এবং পুনর্নবীকরণ − একটি মাত্রায় পৃথক টেবিলের একটি শ্রেণিবিন্যাসকে অস্বাভাবিক করা একটি আদর্শ গুদাম রূপান্তর প্রক্রিয়া। কিছু ডেটা স্টেজিং টুল একটি স্টার স্কিমা বৈশিষ্ট্য অফার করে যা স্বয়ংক্রিয়ভাবে এই ফাংশনটি সম্পাদন করে। তদুপরি, কিছু অস্বাভাবিককরণ ফ্যাক্ট টেবিল ফেজে সঞ্চালিত হয়।

উদাহরণস্বরূপ, একটি আর্থিক স্কিমার একটি মাত্রা থাকতে পারে যা পরিমাণের ধরন, প্রকৃত, বাজেট বা পূর্বাভাসের মান সহ। এটি এই রেকর্ডগুলির বিশদ স্তরের উপর নির্ভর করে, এই কলামটিকে ডলারের পরিমাণের তিনটি কলাম সহ একটি একক সারিতে পিভট করা অনেক অর্থবহ হতে পারে, প্রতিটি পরিমাণের জন্য একটি।

ক্লিনিং, ডিডুপিং, মার্জ/শুদ্ধ করা৷ − এটি অনেক ডেটা গুদামের জন্য একটি বড় সমস্যা, বিশেষ করে যারা গ্রাহক, ব্যবসা, ডাক্তার এবং রোগীর মতো বাহ্যিক সত্তার সাথে সংশ্লিষ্ট। এটি একটি জটিল প্রক্রিয়া, কিন্তু বেশ কয়েকটি বিক্রেতা এই সমস্যার জন্য বিশেষভাবে সরঞ্জাম এবং পরিষেবা সরবরাহ করে৷

ডেটা টাইপ রূপান্তর - এটি একটি ডেটা টাইপ বা ফর্ম্যাটকে অন্যটিতে রূপান্তরিত করে নিম্ন-স্তরের রূপান্তরগুলি জড়িত৷ এটি IBM-এর মেইনফ্রেম অক্ষর সেট EBCDIC কে ASCII তে রূপান্তর করা থেকে শুরু করে তারিখ, সংখ্যাসূচক এবং অক্ষর উপস্থাপনাকে এক ডাটাবেস থেকে অন্য ডাটাবেসে রূপান্তর করতে পারে৷

গণনা, আহরণ, বরাদ্দ - এগুলি হল ব্যবসার নিয়মগুলি ব্যবহার করার জন্য রূপান্তর যা এটি প্রয়োজনীয়তার পর্যায়ে স্বীকৃত হয়৷ স্ট্রিং ম্যানিপুলেশন, তারিখ এবং সময় গাণিতিক, শর্তসাপেক্ষ বিবৃতি এবং মৌলিক গণিত সহ এটি যে টুলটি বেছে নিতে পারে তার একটি সম্পূর্ণ সেট উপলব্ধ রয়েছে তা নিশ্চিত করুন৷

সমষ্টি - লোড প্রক্রিয়ার কিছু উপাদানে একত্রীকরণ পরিচালনা করা যেতে পারে, কোন পর্যায়ে কোন সংস্থানগুলি অ্যাক্সেসযোগ্য তার উপর ভিত্তি করে। যদি এটি নির্যাস বা রূপান্তর প্রক্রিয়ার একটি উপাদান হিসাবে একত্রিতকরণ গণনা করতে পারে, তাহলে ফ্ল্যাট রেকর্ডে সরাসরি সিঙ্কসর্টের মতো সরঞ্জামগুলি ব্যবহার করা সম্ভব। এই ইউটিলিটিগুলি বাছাই এবং রিপোর্ট করার জন্য তৈরি করা হয়েছে এবং এটি সম্পূর্ণরূপে ভাল৷


  1. ডেটা মাইনিং ইন্টারফেস কি?

  2. ডেটা ইন্টিগ্রিটি কত প্রকার?

  3. তথ্য নিরাপত্তা নিরাপত্তা সেবা কি কি?

  4. স্টেগানোগ্রাফির প্রয়োগ কী?