ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন পারস্পরিক সম্পর্ক, নিদর্শন এবং প্রবণতা খুঁজে বের করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷
এটি ডাটাবেসের মালিকের জন্য পরিষ্কার এবং উপকারী ফলাফল পেতে প্রথমে অজানা নিয়মিততা বা সম্পর্কগুলি খুঁজে পাওয়ার জন্য উচ্চ পরিমাণে তথ্যের নির্বাচন, অন্বেষণ এবং মডেলিংয়ের পদ্ধতি।
ডেটা মাইনিং ডেটা সায়েন্সের মতো। এটি একটি ব্যক্তি দ্বারা বাহিত হয়, একটি নির্দিষ্ট পরিস্থিতিতে, একটি নির্দিষ্ট ডেটা সেটে, একটি উদ্দেশ্য সহ। এই পর্বে টেক্সট মাইনিং, ওয়েব মাইনিং, অডিও এবং ভিডিও মাইনিং, সচিত্র ডেটা মাইনিং এবং সোশ্যাল মিডিয়া মাইনিং সহ বিভিন্ন ধরণের পরিষেবা রয়েছে। এটি সফ্টওয়্যারের মাধ্যমে সম্পন্ন হয় যা সহজ বা অত্যন্ত নির্দিষ্ট।
ডেটা মাইনিং আউটসোর্সিং করে, কম অপারেশন খরচে সমস্ত কাজ দ্রুত করা যায়। নির্দিষ্ট সংস্থাগুলি ডেটা সংরক্ষণ করতে নতুন প্রযুক্তি ব্যবহার করতে পারে যা ম্যানুয়ালি খুঁজে পাওয়া অসম্ভব। একাধিক প্ল্যাটফর্মে প্রচুর পরিমাণে ডেটা উপলব্ধ রয়েছে, তবে খুব সীমিত জ্ঞান অ্যাক্সেসযোগ্য৷
৷প্রধান চ্যালেঞ্জ হল প্রয়োজনীয় ডেটা বের করার জন্য ডেটা বিশ্লেষণ করা যা একটি সমস্যা সমাধান করতে বা কোম্পানির উন্নয়নের জন্য ব্যবহার করা যেতে পারে। ডেটা মাইন করার জন্য অনেক গতিশীল যন্ত্র এবং কৌশল উপলব্ধ রয়েছে এবং এটি থেকে আরও ভাল রায় আবিষ্কার করা যায়৷
ডেটা মাইনিং ডেটাবেসে জ্ঞান আবিষ্কার (KDD) নামেও পরিচিত . একটি প্রক্রিয়া হিসাবে জ্ঞান আবিষ্কারের মধ্যে নিম্নলিখিত ধাপগুলির একটি পুনরাবৃত্তিমূলক সিরিজ রয়েছে -
-
ডেটা পরিষ্কার করা - এটা গোলমাল এবং অসংলগ্ন তথ্য দূর করতে পারে।
-
ডেটা ইন্টিগ্রেশন − ডেটা ইন্টিগ্রেশনে, যেখানে একাধিক ডেটা উত্স সংযুক্ত করা যেতে পারে৷
৷ -
ডেটা নির্বাচন − ডেটা নির্বাচনে, যেখানে বিশ্লেষণ ফাংশনের সাথে প্রাসঙ্গিক ডেটা ডেটাবেস থেকে আনা হয়৷
-
ডেটা রূপান্তর − ডেটা ট্রান্সফরমেশনে, যেখানে ডেটা রূপান্তরিত হয় বা সারাংশ বা একত্রীকরণ ক্রিয়াকলাপ সম্পাদন করে খনির জন্য প্রযোজ্য ফর্মগুলিতে লিঙ্ক করা হয়৷
-
ডেটা মাইনিং − এটি একটি গুরুত্বপূর্ণ পর্যায় যেখানে ডেটা প্যাটার্ন বের করতে বুদ্ধিমান পদ্ধতি ব্যবহার করা হয়।
-
প্যাটার্ন মূল্যায়ন − এটি কিছু আকর্ষণীয় ব্যবস্থার উপর ভিত্তি করে জ্ঞানকে সংজ্ঞায়িত করে সত্যিকারের আকর্ষণীয় প্যাটার্ন চিনতে পারে৷
-
জ্ঞান উপস্থাপনা − জ্ঞানের উপস্থাপনায়, যেখানে ভিজ্যুয়ালাইজেশন এবং জ্ঞান উপস্থাপনের পদ্ধতি ব্যবহার করা হয় গ্রাহকের কাছে মাইনড জ্ঞান তুলে ধরতে।