ডেটা মাইনিং বিপুল পরিমাণ ডেটা থেকে জ্ঞান আহরণ বা খনির সংজ্ঞায়িত করে। ডেটা মাইনিং সাধারণত এমন জায়গায় ব্যবহার করা হয় যেখানে বিপুল পরিমাণ ডেটা সংরক্ষণ এবং প্রক্রিয়া করা হয়। উদাহরণস্বরূপ, ব্যাঙ্কিং সিস্টেম বিপুল পরিমাণ ডেটা সংরক্ষণ করতে ডেটা মাইনিং ব্যবহার করে যা ক্রমাগত প্রক্রিয়া করা হয়৷
ডেটা মাইনিং-এ, ডেটার লুকানো প্যাটার্নগুলি একাধিক বিভাগ অনুসারে দরকারী ডেটার একটি অংশে বিবেচনা করা হয়। এই ডেটা বিশ্লেষণের জন্য ডেটা গুদাম সহ একটি এলাকায় একত্রিত করা হয় এবং ডেটা মাইনিং অ্যালগরিদমগুলি সঞ্চালিত হয়। এই ডেটা কার্যকর সিদ্ধান্ত তৈরি করতে সহায়তা করে যা মূল্য হ্রাস করে এবং রাজস্ব বাড়ায়।
বিভিন্ন ধরণের ডেটা মাইনিং অ্যাপ্লিকেশন রয়েছে যা ডেটার জন্য ব্যবহৃত হয় -
-
রিলেশনাল ডাটাবেস - একটি ডাটাবেস সিস্টেমকে ডাটাবেস ম্যানেজমেন্ট সিস্টেমও বলা হয়। এতে আন্তঃসম্পর্কিত ডেটার একটি সেট রয়েছে, যাকে ডাটাবেস বলা হয় এবং ডেটা পরিচালনা ও অ্যাক্সেস করার জন্য সফ্টওয়্যার প্রোগ্রামগুলির একটি সেট।
একটি রিলেশনাল ডাটাবেস হল টেবিলের একটি সেট, যার প্রতিটি একটি অনন্য নাম অনুমোদিত। প্রতিটি টেবিলে বৈশিষ্ট্যের একটি সেট (কলাম বা ক্ষেত্র) অন্তর্ভুক্ত থাকে এবং সাধারণত একটি বিশাল সেট (রেকর্ড বা সারি) সংরক্ষণ করে। একটি রিলেশনাল টেবিলের প্রতিটি টিপল একটি অনন্য কী দ্বারা চিহ্নিত একটি বস্তুকে সংজ্ঞায়িত করে এবং বৈশিষ্ট্য মানের একটি সেট দ্বারা প্রতিনিধিত্ব করে। একটি সত্তা-সম্পর্ক (ER) ডেটা মডেল সহ একটি শব্দার্থিক ডেটা মডেল সাধারণত রিলেশনাল ডাটাবেসের জন্য তৈরি করা হয়। একটি ER ডেটা মডেল ডেটাবেসকে সত্তা এবং তাদের সম্পর্কগুলির একটি সেট হিসাবে সংজ্ঞায়িত করে৷
৷-
লেনদেন সংক্রান্ত ডেটাবেস - একটি লেনদেন সংক্রান্ত ডাটাবেস একটি ফাইল অন্তর্ভুক্ত করে যেখানে প্রতিটি রেকর্ড একটি লেনদেন সংজ্ঞায়িত করে। একটি লেনদেনে সাধারণত একটি অনন্য লেনদেন পরিচয় নম্বর (ট্রান্স আইডি) এবং লেনদেন তৈরি করা আইটেমগুলির একটি তালিকা থাকে (যেমন একটি দোকানে কেনা আইটেম)।
লেনদেন সংক্রান্ত ডাটাবেসের সাথে সম্পর্কিত অতিরিক্ত সারণী থাকতে পারে, যার মধ্যে লেনদেনের তারিখ, গ্রাহক আইডি নম্বর, বিক্রয়কর্মীর আইডি নম্বর এবং যে শাখায় বিক্রয় উপস্থিত হয়েছিল, ইত্যাদি সহ বিক্রয় সংক্রান্ত অন্যান্য ডেটা অন্তর্ভুক্ত থাকে৷
-
অবজেক্ট-রিলেশনাল ডেটাবেস − অবজেক্ট-রিলেশনাল ডেটাবেসগুলি একটি অবজেক্ট-রিলেশনাল ডেটা মডেলের উপর ভিত্তি করে একত্রিত হয়। জটিল অবজেক্ট এবং অবজেক্ট ওরিয়েন্টেশন পরিচালনার জন্য একটি সমৃদ্ধ ডেটা টাইপ সমর্থন করে এই মডেলটি রিলেশনাল মডেলটি চালিয়ে যায়।
-
টেম্পোরাল ডাটাবেস − একটি টেম্পোরাল ডাটাবেস সাধারণত রিলেশনাল ডেটা সঞ্চয় করে যাতে সময়-সম্পর্কিত বৈশিষ্ট্য থাকে। এই বৈশিষ্ট্যগুলির মধ্যে একাধিক টাইমস্ট্যাম্প অন্তর্ভুক্ত থাকতে পারে, প্রতিটিতে বেশ কয়েকটি শব্দার্থ আছে৷
-
সিকোয়েন্স ডেটাবেস − একটি সিকোয়েন্স ডাটাবেস সময়ের একটি বাস্তব ধারণা সহ বা ছাড়াই অর্ডারকৃত ইভেন্টের ক্রম সঞ্চয় করে। উদাহরণস্বরূপ, গ্রাহক কেনাকাটার ক্রম, ওয়েব ক্লিক স্ট্রীম এবং জৈবিক ক্রম।
-
টাইম-সিরিজ ডেটাবেস − একটি টাইম-সিরিজ ডাটাবেস সময়ের পুনরাবৃত্ত পরিমাপের মাধ্যমে অ্যাক্সেস করা মান বা ইভেন্টের ক্রম সঞ্চয় করে (যেমন, ঘণ্টায়, দৈনিক, সাপ্তাহিক)। একটি উদাহরণের মধ্যে রয়েছে স্টক এক্সচেঞ্জ থেকে সংগৃহীত ডেটা, স্টক নিয়ন্ত্রণ এবং প্রাকৃতিক ঘটনার পরিমাপ (যেমন তাপমাত্রা এবং বাতাস)।