কম্পিউটার

ডেটা মাইনিং রূপান্তর কি?


ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন সম্পর্ক, নিদর্শন এবং প্রবণতাগুলি সন্ধান করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করতে এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলিকে সংক্ষিপ্ত করার জন্য তথ্যভিত্তিক ডেটাসেটের বিশ্লেষণ৷

ডেটা মাইনিংয়ের বিভিন্ন রূপান্তর রয়েছে যা নিম্নরূপ -

স্বাভাবিক, অস্বাভাবিক, সীমার বাইরে, বা অসম্ভব ঘটনাগুলিকে ফ্ল্যাগ করুন − বিশেষ পতাকা দিয়ে পরিমাপকৃত তথ্য চিহ্নিত করা সম্পূর্ণ উপকারী হতে পারে। কিছু পরিমাপকৃত তথ্য সঠিক কিন্তু অত্যন্ত অস্বাভাবিক হতে পারে। সম্ভবত এই তথ্যগুলি একটি ছোট নমুনা বা একটি নির্দিষ্ট পরিস্থিতিতে প্রতিষ্ঠিত হয়েছে৷

অন্যান্য তথ্য তথ্য উপস্থিত হতে পারে কিন্তু অসম্ভব বা অবর্ণনীয় হিসাবে গণ্য করা আবশ্যক. এই প্রতিটি পরিস্থিতির জন্য, একটি স্ট্যাটাস ফ্ল্যাগ দিয়ে ডেটা চিহ্নিত করা ভাল যাতে এটি টেবিল থেকে অস্বাভাবিক মান মুছে ফেলার পরিবর্তে বিশ্লেষণের মধ্যে বা বাইরে সীমাবদ্ধ হতে পারে৷

এই কেসগুলি পরিচালনা করার একটি ভাল উপায় হল ফ্যাক্ট রেকর্ডের জন্য একটি বিশেষ ডেটা স্ট্যাটাস ডাইমেনশন তৈরি করা। এটি একটি সীমাবদ্ধতা হিসাবে এবং প্রতিটি সত্যের অবস্থা সংজ্ঞায়িত করার জন্য এই মাত্রার প্রয়োজন হতে পারে।

প্রসঙ্গ থেকে এলোমেলো বা শব্দের মান চিনুন এবং মুখোশ আউট করুন − পূর্ববর্তী রূপান্তরের একটি বিশেষ ক্ষেত্রে যখন উত্তরাধিকার ব্যবস্থা একটি বাস্তব সত্যের পরিবর্তে একটি এলোমেলো সংখ্যা সরবরাহ করেছে তা সনাক্ত করা। এটি ঘটতে পারে যখন উত্তরাধিকার সিস্টেমের দ্বারা কোনো মান প্রদান করা হয় না, তবে একটি বাফারে অবশিষ্ট একটি সংখ্যা ডেটা গুদামে পাঠানো হয়। যখন এই কেসটি চিহ্নিত করা হয়, তখন র্যান্ডম নম্বরটি একটি শূন্য মান দিয়ে পুনরুদ্ধার করা উচিত।

শূন্য মানগুলিতে একটি অভিন্ন চিকিত্সা প্রয়োগ করুন − ডেটা মাইনিং টুল "অস্তিত্ব থাকতে পারে না" এবং "অস্তিত্ব আছে কিন্তু অজানা" এর মধ্যে পার্থক্যের জন্য সংবেদনশীল। কিছু ডেটা মাইনিং পেশাদার দ্বিতীয় ক্ষেত্রে একটি সম্ভাব্য বা মধ্যম মান নির্ধারণ করে যাতে বাকি তথ্য সারণী রেকর্ড বিশ্লেষণে অংশগ্রহণ করতে পারে।

এটি আনুমানিক মানের সাথে নাল মানকে ওভাররাইট করে মূল ডেটাতে করা যেতে পারে, অথবা এটি একটি অত্যাধুনিক ডেটা মাইনিং টুল দ্বারা পরিচালিত হতে পারে যা বিভিন্ন বিশ্লেষণ বিকল্পের সাথে নাল ডেটা কীভাবে প্রক্রিয়া করতে হয় তা জানে৷

পরিবর্তিত স্থিতি সহ ফ্ল্যাগ ফ্যাক্ট রেকর্ড − একটি সহায়ক ডেটা ট্রান্সফরমেশন হল একটি ফ্যাক্ট টেবিল রেকর্ডে একটি বিশেষ স্থিতি সূচক যোগ করা যাতে দেখা যায় যে সেই অ্যাকাউন্টের (বা গ্রাহক বা পণ্য বা অবস্থান) অবস্থা সবেমাত্র পরিবর্তিত হয়েছে বা পরিবর্তন হতে চলেছে। স্ট্যাটাস ইন্ডিকেটর স্টার জয়েন ডিজাইনে স্ট্যাটাস ডাইমেনশন হিসেবে প্রয়োগ করা হয়।


  1. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  2. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?

  3. ডেটা মাইনিংয়ে আউটলায়ারের ধরন কী কী?

  4. গোপনীয়তা-সংরক্ষণের ডেটা মাইনিংয়ের পদ্ধতিগুলি কী কী?