ডেটা মাইনিং হল ডাটাবেসের মালিকের জন্য পরিষ্কার এবং উপকারী ফলাফল পেতে প্রথমে অজানা নিয়মিততা বা সম্পর্কগুলি খুঁজে পেতে উচ্চ পরিমাণে তথ্যের নির্বাচন, অনুসন্ধান এবং মডেলিংয়ের পদ্ধতি।
ডেটা মাইনিং হল একটি আন্তঃবিভাগীয় ক্ষেত্র, ডাটাবেস সিস্টেম, পরিসংখ্যান, মেশিন লার্নিং, ভিজ্যুয়ালাইজেশন এবং ডেটা বিজ্ঞানের মতো শৃঙ্খলাগুলির একটি সেটের সমাবেশ। এটি ব্যবহৃত ডেটা মাইনিং পদ্ধতির উপর ভিত্তি করে, নিউরাল নেটওয়ার্ক, অস্পষ্ট এবং রুক্ষ সেট তত্ত্ব, জ্ঞান উপস্থাপনা, প্রবর্তক লজিক প্রোগ্রামিং, বা উচ্চ-পারফরম্যান্স কম্পিউটিং সহ অন্যান্য শাখার পদ্ধতিগুলি ব্যবহার করা যেতে পারে৷
এটি খনন করা ডেটার প্রকারের উপর বা প্রদত্ত ডেটা মাইনিং অ্যাপ্লিকেশনের উপর প্রতিষ্ঠিত, ডেটা মাইনিং সিস্টেম স্থানিক ডেটা বিশ্লেষণ, ডেটা পুনরুদ্ধার, প্যাটার্ন সনাক্তকরণ, চিত্র বিশ্লেষণ, সংকেত প্রক্রিয়াকরণ, কম্পিউটার গ্রাফিক্স, নেটওয়ার্ক প্রযুক্তি, অর্থনীতি, ব্যবসা, বায়োইনফরমেটিক্স বা মনোবিজ্ঞান।
একটি ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইন করা যেতে পারে এই আদিম বিষয়গুলিকে অন্তর্ভুক্ত করার জন্য, ব্যবহারকারীদের নমনীয়ভাবে ডেটা মাইনিং সিস্টেমের সাথে সংযোগ করতে সক্ষম করে৷ একটি ডেটা মাইনিং কোয়েরি ভাষা এমন একটি কর্তৃপক্ষকে সমর্থন করে যার উপর ব্যবহারকারী-বান্ধব গ্রাফিকাল ইন্টারফেস তৈরি করা যেতে পারে। এটি একটি ডেটা মাইনিং সিস্টেমের অন্যান্য ডেটা সিস্টেমের সাথে যোগাযোগ এবং সম্পূর্ণ ডেটা প্রক্রিয়াকরণ পরিবেশের সাথে এর একীকরণকে প্রচার করে৷
এটি একটি অন্তর্ভুক্তিমূলক ডেটা মাইনিং ল্যাঙ্গুয়েজ ডিজাইন করছে যা চ্যালেঞ্জিং কারণ ডেটা মাইনিং ডেটা চরিত্রায়ন থেকে বিবর্তন বিশ্লেষণ পর্যন্ত বিস্তৃত ফাংশনকে রক্ষা করে। প্রতিটি কাজের বেশ কয়েকটি প্রয়োজনীয়তা রয়েছে। একটি কার্যকর ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইনের জন্য বিভিন্ন ধরণের ডেটা মাইনিং কাজের ক্ষমতা, সীমাবদ্ধতা এবং অন্তর্নিহিত কাঠামোর বিস্তৃত শিক্ষার প্রয়োজন৷
ডেটা মাইনিং কার্যকারিতাগুলি ডেটা মাইনিং কার্যগুলিতে আবিষ্কৃত হওয়া নিদর্শনগুলির ধরণ নির্ধারণ করতে ব্যবহৃত হয়। সাধারণভাবে, ডেটা মাইনিং কাজগুলিকে বর্ণনামূলক এবং ভবিষ্যদ্বাণীমূলক সহ দুটি প্রকারে শ্রেণীবদ্ধ করা যেতে পারে। বর্ণনামূলক খনির কাজগুলি ডাটাবেসের ডেটার সাধারণ বৈশিষ্ট্যগুলিকে সংজ্ঞায়িত করে এবং ভবিষ্যদ্বাণীমূলক খনির কাজগুলি ভবিষ্যদ্বাণীগুলি বিকাশের জন্য বর্তমান তথ্যের উপর ভিত্তি করে৷
ডাটা মাইনিং এর প্রধান উপাদানগুলো হল নিম্নরূপ −
- ডাটাবেস − এটি একটি বা ডেটাবেস, ডেটা গুদাম, স্প্রেডশীট এবং অন্য ধরনের ডেটা ভান্ডারের একটি সেট যেখানে ডেটা পরিষ্কার এবং একীকরণ কৌশলগুলি প্রয়োগ করা যেতে পারে৷
- ডেটা গুদাম সার্ভার − এই উপাদানটি ডেটা গুদাম থেকে ব্যবহারকারীদের অনুরোধের ভিত্তিতে প্রাসঙ্গিক রেকর্ড নিয়ে আসে৷
- জ্ঞানের ভিত্তি − এটি একটি জ্ঞানের ডোমেন যা আকর্ষণীয় নিদর্শন আবিষ্কারের জন্য নিযুক্ত করা হয়।
- ডেটা মাইনিং ইঞ্জিন - এটি একটি কার্যকরী মডিউল ব্যবহার করে যা শ্রেণীবিভাগ, সমিতি, ক্লাস্টার বিশ্লেষণ, ইত্যাদি সহ কার্য সম্পাদন করতে ব্যবহৃত হয়৷
- প্যাটার্ন মূল্যায়ন মডিউল − এই উপাদানটি আকর্ষণীয় নিদর্শনগুলির দিকে অনুসন্ধানকে লক্ষ্য করতে ডেটা মাইনিং কাঠামোর সাথে যোগাযোগ করে এমন আকর্ষণীয়তা পরিমাপ ব্যবহার করে৷
- ইউজার ইন্টারফেস − এই ইন্টারফেস ব্যবহারকারীদের একটি ডেটা মাইনিং ফাংশন বা গ্রাফিক্যাল ইউজার ইন্টারফেসের মাধ্যমে একটি প্রশ্ন বর্ণনা করে সিস্টেমের সাথে ইন্টারঅ্যাক্ট করতে সক্ষম করে৷