ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন সম্পর্ক, নিদর্শন এবং প্রবণতাগুলি সন্ধান করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷
এটি ডাটাবেসের মালিকের জন্য পরিষ্কার এবং উপকারী ফলাফল পেতে প্রথমে অজানা নিয়মিততা বা সম্পর্ক খুঁজে বের করার জন্য উচ্চ পরিমাণে তথ্যের নির্বাচন, অন্বেষণ এবং মডেলিংয়ের পদ্ধতি।
ডেটা মাইনিং ডেটা সায়েন্সের মতো। এটি একটি ব্যক্তি দ্বারা বাহিত হয়, একটি নির্দিষ্ট পরিস্থিতিতে, একটি নির্দিষ্ট ডেটা সেটে, একটি উদ্দেশ্য সহ। এই পর্বে টেক্সট মাইনিং, ওয়েব মাইনিং, অডিও এবং ভিডিও মাইনিং, সচিত্র ডেটা মাইনিং এবং সোশ্যাল মিডিয়া মাইনিং সহ বিভিন্ন ধরণের পরিষেবা রয়েছে। এটি সফ্টওয়্যারের মাধ্যমে সম্পন্ন হয় যা সহজ বা অত্যন্ত নির্দিষ্ট।
Metarules ব্যবহারকারীদের তারা খনির সাথে জড়িত নিয়মের সিনট্যাকটিক ফর্ম সংজ্ঞায়িত করতে সক্ষম করে। খনির ধাপের কার্যকারিতা উন্নত করতে নিয়ম ফর্মগুলিকে সীমাবদ্ধতা হিসাবে ব্যবহার করা যেতে পারে। মেটারুলগুলি বিশ্লেষকের অভিজ্ঞতা, প্রত্যাশা, বা ডেটা সম্পর্কিত অন্তর্দৃষ্টির উপর ভিত্তি করে তৈরি হতে পারে বা ডাটাবেস স্কিমার উপর নির্ভর করে স্বয়ংক্রিয়ভাবে তৈরি হতে পারে।
মেটারুল-গাইডেড মাইনিং − বিবেচনা করুন যে AllElectronics-এর বাজার বিশ্লেষক হিসাবে, এটি গ্রাহকদের সংজ্ঞায়িত ডেটা (গ্রাহকের বয়স, ঠিকানা এবং ক্রেডিট রেটিং সহ) এবং গ্রাহক লেনদেনের তালিকা অ্যাক্সেস করতে পারে৷
এটি গ্রাহকের বৈশিষ্ট্য এবং গ্রাহকরা ক্রয় করা আইটেমগুলির মধ্যে সমিতি খুঁজে পেতে পারে। যাইহোক, এই সম্পর্কগুলিকে প্রতিফলিত করে এমন কিছু অ্যাসোসিয়েশন নিয়ম খোঁজার পরিবর্তে, এটি শুধুমাত্র সিদ্ধান্ত নিতে আগ্রহী যে কোন জোড়া গ্রাহক বৈশিষ্ট্যগুলি অফিস সফ্টওয়্যার বিক্রি বাড়ায়৷
এই ধরনের একটি metarule একটি উদাহরণ হল
পি1 (X, Y)∧ P2 (X, W) ⇒ ক্রয় করে(X, “অফিস সফ্টওয়্যার”)
যেখানে P1 এবং P2 প্রিডিকেট ভেরিয়েবল যা মাইনিং পর্বের সময় প্রদত্ত ডাটাবেস থেকে অ্যাট্রিবিউটের জন্য ইনস্ট্যান্ট করা হয়, X হল একটি ভেরিয়েবল যা একজন গ্রাহককে সংজ্ঞায়িত করে, এবং Y এবং W P1-কে বরাদ্দ করা বৈশিষ্ট্যগুলির মান গ্রহণ করে এবং P2 , সেই অনুযায়ী।
সাধারনত, একজন ব্যবহারকারী P1 দিয়ে ইনস্ট্যান্টিয়েশনের জন্য চিকিত্সা করা বৈশিষ্ট্যগুলির একটি তালিকা সংজ্ঞায়িত করতে পারে এবং P2 . অতএব, একটি ডিফল্ট সেট ব্যবহার করা যেতে পারে।
সাধারণভাবে, একটি মেটারুল সেই সম্পর্কের বিষয়ে একটি হাইপোথিসিস গঠন করে যা ব্যবহারকারীকে উপলব্ধি বা নিশ্চিতকরণে জড়িত করা হয়। ডেটা মাইনিং সিস্টেম প্রদত্ত মেটারুলকে সংযুক্ত করে এমন নিয়মগুলি অনুসন্ধান করতে পারে। উদাহরণস্বরূপ,
বয়স(X, “30...39”)∧আয়(X, “41K...60K”) ⇒ কেনাকাটা(X, “অফিস সফটওয়্যার”)