ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা ভাগ করে দরকারী নতুন পারস্পরিক সম্পর্ক, নিদর্শন এবং প্রবণতা খুঁজে বের করার পদ্ধতি। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷
এটি ডাটাবেসের মালিকের জন্য পরিষ্কার এবং উপকারী ফলাফল পেতে প্রথমে অজানা নিয়মিততা বা সম্পর্ক খুঁজে বের করার জন্য উচ্চ পরিমাণে তথ্যের নির্বাচন, অন্বেষণ এবং মডেলিংয়ের পদ্ধতি।
এটি কম্পিউটার অ্যালগরিদম বা পরিসংখ্যান কৌশল ব্যবহারের মধ্যে সীমাবদ্ধ নয়। এটি ব্যবসায়িক বুদ্ধিমত্তার একটি প্রক্রিয়া যা কোম্পানির সিদ্ধান্তগুলিকে সমর্থন করার জন্য তথ্য প্রযুক্তির সাথে একসাথে ব্যবহার করা যেতে পারে৷
ডেটা মাইনিং ডেটা সায়েন্সের মতো। এটি একটি ব্যক্তি দ্বারা বাহিত হয়, একটি নির্দিষ্ট পরিস্থিতিতে, একটি নির্দিষ্ট ডেটা সেটে, একটি উদ্দেশ্য সহ। এই পর্বে টেক্সট মাইনিং, ওয়েব মাইনিং, অডিও এবং ভিডিও মাইনিং, সচিত্র ডেটা মাইনিং এবং সোশ্যাল মিডিয়া মাইনিং সহ বিভিন্ন ধরণের পরিষেবা রয়েছে। এটি সফ্টওয়্যারের মাধ্যমে সম্পন্ন হয় যা সহজ বা অত্যন্ত নির্দিষ্ট।
ডেটা মাইনিং বর্তমান বছরগুলিতে তথ্য বাজার এবং সামগ্রিকভাবে সমাজে প্রচুর মনোযোগ আকর্ষণ করেছে, কারণ বিপুল পরিমাণ ডেটার বিস্তৃত প্রাপ্যতা এবং এই জাতীয় ডেটাকে উপকারী ডেটা এবং জ্ঞানে পরিণত করার জন্য আসন্ন প্রয়োজনীয়তার কারণে। অর্জিত তথ্য এবং জ্ঞান শিল্প বিশ্লেষণ, জালিয়াতি সনাক্তকরণ, এবং ব্যবহারকারী ধারণ থেকে উৎপাদন নিয়ন্ত্রণ এবং বিজ্ঞান অনুসন্ধান পর্যন্ত সফ্টওয়্যারের জন্য ব্যবহার করা যেতে পারে৷
ডেটা মাইনিংকে ডেটা প্রযুক্তির প্রাকৃতিক অগ্রগতির ফল হিসাবে বিবেচনা করা যেতে পারে। ডেটাবেস সিস্টেম মার্কেট ডেটা সংগ্রহ এবং ডাটাবেস তৈরি, ডেটা ম্যানেজমেন্ট এবং উন্নত ডেটা বিশ্লেষণ সহ নিম্নলিখিত কার্যকারিতাগুলির বিকাশে একটি বিবর্তনীয় দিক সমর্থন করেছে৷
উদাহরণস্বরূপ, ডেটা সংগ্রহ এবং ডেটাবেস তৈরির কাঠামোর সাম্প্রতিক বিকাশ ডেটা স্টোরেজ এবং পুনরুদ্ধার এবং অনুসন্ধান এবং লেনদেন প্রক্রিয়াকরণের জন্য একটি কার্যকর কাঠামোর পরবর্তী বিকাশের জন্য প্রয়োজনীয় হিসাবে কাজ করেছে। সাধারণ অনুশীলন হিসাবে বিভিন্ন ডাটাবেস সিস্টেম ক্যোয়ারী এবং লেনদেন প্রক্রিয়াকরণ প্রদান করে, উন্নত ডেটা বিশ্লেষণ পরবর্তী বস্তুতে বিকশিত হয়েছে।
ডাটা বিভিন্ন ধরনের ডাটাবেস এবং ডাটা রিপোজিটরিতে সংরক্ষণ করা যায়। একটি ডেটা ভান্ডারের কাঠামো যা ডেটা গুদামে উপস্থিত হয়েছে, ব্যবস্থাপনার সিদ্ধান্ত গ্রহণকে সমর্থন করার জন্য একটি পৃথক সাইটে একটি ইউনিফাইড স্কিমার অধীনে সংগঠিত বেশ কয়েকটি ভিন্ন ভিন্ন ডেটা উত্সের একটি সংগ্রহস্থল৷
ডেটা গুদাম প্রযুক্তিতে ডেটা পরিষ্কার করা, ডেটা ইন্টিগ্রেশন, এবং অনলাইন অ্যানালিটিক্যাল প্রসেসিং (OLAP), বিশেষ করে, সারসংক্ষেপ, একত্রীকরণ এবং একত্রীকরণ সহ কার্যকারিতা সহ বিশ্লেষণ কৌশল এবং একাধিক কোণ থেকে ডেটা দেখার ক্ষমতা জড়িত৷