ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন সম্পর্ক, নিদর্শন এবং প্রবণতাগুলি সন্ধান করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷
একটি ডেটা মাইনিং কাজ একটি ডেটা মাইনিং প্রশ্নের ডিজাইনে সংজ্ঞায়িত করা যেতে পারে, যা ডেটা মাইনিং সিস্টেমে ইনপুট। একটি ডেটা মাইনিং কোয়েরি ডেটা মাইনিং টাস্ক আদিম অবস্থার মধ্যে উপস্থাপন করা হয়। এই আদিম উপাদানগুলি খনির প্রক্রিয়া পরিচালনা করতে বা একাধিক কোণ বা গভীরতা থেকে ফলাফলগুলি পরীক্ষা করার জন্য আবিষ্কারের সময় ডেটা মাইনিং সিস্টেমের সাথে পারস্পরিকভাবে সংযোগ করতে ব্যবহারকারীকে সক্ষম করে৷
ডেটা মাইনিংয়ের কাজটি নিম্নরূপ -
খনন করা টাস্ক-প্রাসঙ্গিক ডেটার সেট - এটি ডেটাবেসের অংশ বা তথ্যের সেটকে সংজ্ঞায়িত করে যেখানে ব্যবহারকারী উদ্বিগ্ন। এটি ডাটাবেস বৈশিষ্ট্য বা আগ্রহের ডেটা গুদামের মাত্রা জড়িত (প্রাসঙ্গিক বৈশিষ্ট্য বা মাত্রা হিসাবে সংজ্ঞায়িত)।
যে ধরনের জ্ঞান খনন করতে হবে − এটি চরিত্রায়ন, বৈষম্য, সমিতি বা পারস্পরিক সম্পর্ক বিশ্লেষণ, শ্রেণিবিন্যাস, ভবিষ্যদ্বাণী, ক্লাস্টারিং, আউটলিয়ার বিশ্লেষণ, বা বিবর্তন বিশ্লেষণ সহ পরিচালিত ডেটা মাইনিং ফাংশনগুলিকে সংজ্ঞায়িত করে৷
আবিষ্কার প্রক্রিয়ায় ব্যবহৃত পটভূমি জ্ঞান − খনন করা ডোমেন সম্পর্কে এই জ্ঞান জ্ঞান আবিষ্কারের প্রক্রিয়া এবং প্রতিষ্ঠিত নিদর্শনগুলি গণনা করতে সহায়তা করে। ধারণা শ্রেণিবিন্যাস হল পটভূমি জ্ঞানের একটি বিখ্যাত রূপ, যা বিমূর্তকরণের বিভিন্ন পদ্ধতিতে ডেটা খনন করতে সক্ষম করে।
প্যাটার্ন মূল্যায়নের জন্য আকর্ষণীয়তার পরিমাপ এবং থ্রেশহোল্ড − এগুলি খনির প্রক্রিয়া পরিচালনা করতে বা আবিষ্কারের পরে, আবিষ্কৃত নিদর্শনগুলি গণনা করতে ব্যবহার করা যেতে পারে। একাধিক ধরণের জ্ঞানের বিভিন্ন আকর্ষণীয় পরিমাপ থাকতে পারে।
আবিষ্কৃত নিদর্শনগুলিকে কল্পনা করার জন্য প্রত্যাশিত উপস্থাপনা৷ − এটি সেই ফর্মের প্রতিনিধিত্ব করে যেখানে আবিষ্কৃত প্যাটার্নগুলি উপস্থাপন করা হবে, যাতে নিয়ম, টেবিল, চার্ট, গ্রাফ, সিদ্ধান্ত গাছ এবং কিউব থাকতে পারে৷
একটি ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইন করা যেতে পারে এই আদিম বিষয়গুলিকে অন্তর্ভুক্ত করার জন্য, ব্যবহারকারীদের নমনীয়ভাবে ডেটা মাইনিং সিস্টেমের সাথে সংযোগ করতে সক্ষম করে৷ একটি ডেটা মাইনিং কোয়েরি ভাষা এমন একটি কর্তৃপক্ষকে সমর্থন করে যার উপর ব্যবহারকারী-বান্ধব গ্রাফিকাল ইন্টারফেস তৈরি করা যেতে পারে। এটি একটি ডেটা মাইনিং সিস্টেমের অন্যান্য ডেটা সিস্টেমের সাথে যোগাযোগ এবং সম্পূর্ণ ডেটা প্রক্রিয়াকরণ পরিবেশের সাথে এর একীকরণকে প্রচার করে৷
এটি একটি অন্তর্ভুক্তিমূলক ডেটা মাইনিং ল্যাঙ্গুয়েজ ডিজাইন করছে যা চ্যালেঞ্জিং কারণ ডেটা মাইনিং ডেটা চরিত্রায়ন থেকে বিবর্তন বিশ্লেষণ পর্যন্ত বিস্তৃত ফাংশনকে রক্ষা করে। প্রতিটি কাজের বেশ কয়েকটি প্রয়োজনীয়তা রয়েছে। একটি কার্যকর ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইনের জন্য বিভিন্ন ধরণের ডেটা মাইনিং কাজের ক্ষমতা, সীমাবদ্ধতা এবং অন্তর্নিহিত কাঠামোর বিস্তৃত শিক্ষার প্রয়োজন৷