ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন সম্পর্ক, নিদর্শন এবং প্রবণতাগুলি সন্ধান করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷
ডেটা মাইনিং হল একটি আন্তঃবিভাগীয় ক্ষেত্র, ডাটাবেস সিস্টেম, পরিসংখ্যান, মেশিন লার্নিং, ভিজ্যুয়ালাইজেশন এবং ডেটা বিজ্ঞানের মতো শৃঙ্খলাগুলির একটি সেটের সমাবেশ। এটি ব্যবহৃত ডেটা মাইনিং পদ্ধতির উপর নির্ভর করে, অন্যান্য শাখার কৌশলগুলি প্রয়োগ করা যেতে পারে, যেমন নিউরাল নেটওয়ার্ক, অস্পষ্ট এবং/অথবা রুক্ষ সেট তত্ত্ব, জ্ঞান উপস্থাপনা, ইন্ডাকটিভ লজিক প্রোগ্রামিং, বা উচ্চ-পারফরম্যান্স কম্পিউটিং৷
ডেটা মাইনিং ডেটা সায়েন্সের মতো। এটি একটি ব্যক্তি দ্বারা বাহিত হয়, একটি নির্দিষ্ট পরিস্থিতিতে, একটি নির্দিষ্ট ডেটা সেটে, একটি উদ্দেশ্য সহ। এই পর্বে টেক্সট মাইনিং, ওয়েব মাইনিং, অডিও এবং ভিডিও মাইনিং, সচিত্র ডেটা মাইনিং এবং সোশ্যাল মিডিয়া মাইনিং সহ বিভিন্ন ধরণের পরিষেবা রয়েছে। এটি সফ্টওয়্যারের মাধ্যমে সম্পন্ন হয় যা সহজ বা অত্যন্ত নির্দিষ্ট।
ডেটা মাইনিং আউটসোর্সিং করে, কম অপারেশন খরচে সমস্ত কাজ দ্রুত করা যায়। নির্দিষ্ট সংস্থাগুলি ডেটা সংরক্ষণ করতে নতুন প্রযুক্তি ব্যবহার করতে পারে যা ম্যানুয়ালি খুঁজে পাওয়া অসম্ভব। একাধিক প্ল্যাটফর্মে প্রচুর পরিমাণে ডেটা উপলব্ধ রয়েছে, তবে খুব সীমিত জ্ঞান অ্যাক্সেসযোগ্য৷
৷প্রধান চ্যালেঞ্জ হল প্রয়োজনীয় ডেটা বের করার জন্য ডেটা বিশ্লেষণ করা যা একটি সমস্যা সমাধান করতে বা কোম্পানির উন্নয়নের জন্য ব্যবহার করা যেতে পারে। ডেটা মাইন করার জন্য অনেক গতিশীল যন্ত্র এবং কৌশল উপলব্ধ রয়েছে এবং এটি থেকে আরও ভাল বিচার আবিষ্কার করা যায়৷
ডেটা মাইনিংয়ের সীমাবদ্ধতাগুলি প্রাথমিকভাবে ডেটা বা কর্মী-সম্পর্কিত, প্রযুক্তি-সম্পর্কিত নয়৷
-
ডেটা মাইনিং সফ্টওয়্যারগুলি খুব শক্তিশালী সরঞ্জাম কিন্তু তারা স্বয়ংসম্পূর্ণ অ্যাপ্লিকেশন নয়। এটি সফল হতে পারে, এবং এর জন্য দক্ষ প্রযুক্তিগত এবং বিশ্লেষণাত্মক বিশেষজ্ঞদের প্রয়োজন যারা বিশ্লেষণকে গঠন করতে পারে এবং তৈরি করা আউটপুটকে ব্যাখ্যা করতে পারে।
-
ডেটা মাইনিং নিদর্শন এবং সম্পর্কগুলি পেতে ব্যবহৃত হয়, এটি ব্যবহারকারীকে এই নিদর্শনগুলির মূল্য বা তাত্পর্য জানায় না। এই ধরনের নির্ণয় অবশ্যই ব্যবহারকারীদের দ্বারা করা উচিত।
-
আবিষ্কৃত নিদর্শনগুলির বৈধতা নির্ভর করে কিভাবে বাস্তব-বিশ্বের পরিস্থিতির সাথে তুলনা করা হয়। উদাহরণস্বরূপ, এটি ডেটা মাইনিং অ্যাপ্লিকেশনগুলির বৈধতা মূল্যায়ন করতে পারে যা সম্ভাব্য সন্ত্রাসী সন্দেহভাজন ব্যক্তিদের একটি বড় পুলে চিহ্নিত করার জন্য ডিজাইন করা হয়েছে, ব্যবহারকারী এমন ডেটা ব্যবহার করে মডেলটি পরীক্ষা করতে পারে যাতে পরিচিত সন্ত্রাসীদের সম্পর্কে তথ্য রয়েছে৷
-
ডেটা মাইনিং আচরণ এবং ভেরিয়েবলের মধ্যে সংযোগ সনাক্ত করতে পারে, এটি অগত্যা একটি কার্যকারণ সম্পর্ক সনাক্ত করে না। উদাহরণস্বরূপ, একটি অ্যাপ্লিকেশন সনাক্ত করতে পারে যে আচরণের একটি ধরণ, যেমন ফ্লাইট ছাড়ার কিছুক্ষণ আগে এয়ারলাইন টিকিট কেনার প্রবণতা, আয়, শিক্ষার স্তর এবং ইন্টারনেট ব্যবহারের মতো বৈশিষ্ট্যগুলির সাথে সম্পর্কিত৷