ডেটা মাইনিং হল কৃত্রিম বুদ্ধিমত্তার একটি রূপ যা মানব মস্তিষ্কের কৌশলগুলি অনুকরণ করতে উপলব্ধি মডেল, বিশ্লেষণাত্মক মডেল এবং একাধিক অ্যালগরিদম ব্যবহার করে। ডেটা মাইনিং মেশিনকে মানুষের সিদ্ধান্ত নিতে এবং মানুষের পছন্দ তৈরি করতে সহায়তা করে।
ডেটা মাইনিং টুলের ব্যবহারকারীকে মেশিনের নিয়ম, পছন্দ, এমনকি অভিজ্ঞতার নির্দেশ দিতে হবে সিদ্ধান্ত সমর্থন করার জন্য ডেটা মাইনিং মেট্রিক্স নিম্নরূপ -
উপযোগিতা − ব্যবহারযোগ্যতার মধ্যে বেশ কয়েকটি মেট্রিক্স জড়িত যা আমাদের বলে যে মডেলটি দরকারী ডেটা প্রদান করে কিনা। উদাহরণস্বরূপ, একটি ডেটা মাইনিং মডেল যা বিক্রয়ের সাথে অবস্থান সংরক্ষণের সাথে সম্পর্কযুক্ত তা নির্ভুল এবং নির্ভরযোগ্য উভয়ই হতে পারে, তবে এটি কার্যকর হতে পারে না, কারণ এটি একই স্থানে আরও স্টোর ঢোকানোর মাধ্যমে ফলাফলটিকে সাধারণীকরণ করতে পারে না।
তদ্ব্যতীত, এটি কেন নির্দিষ্ট অবস্থানগুলিতে বেশি বিক্রি হয় তার মৌলিক ব্যবসায়িক প্রশ্নের উত্তর দেয় না। এটি আরও খুঁজে পেতে পারে যে একটি মডেল যা সফল বলে মনে হয় তা অর্থহীন কারণ এটি ডেটার ক্রস-সম্পর্কের উপর নির্ভর করে।
রিটার্ন অন ইনভেস্টমেন্ট (ROI) − ডেটা মাইনিং সরঞ্জামগুলি ডেটার ভিতরে সমাহিত আকর্ষণীয় নিদর্শনগুলি খুঁজে পাবে এবং ভবিষ্যদ্বাণীমূলক মডেলগুলি বিকাশ করবে। এই মডেলগুলি রেকর্ডের সাথে কতটা মানানসই তা বোঝানোর জন্য বেশ কয়েকটি ব্যবস্থা থাকবে। ডেটা মাইনিং বিশ্লেষণের একটি উপাদান হিসাবে রিপোর্ট করা কিছু ব্যবস্থার উপর ভিত্তি করে কীভাবে একটি সিদ্ধান্ত তৈরি করা যায় তা পরিষ্কার নয়৷
ডেটা মাইনিংয়ের সময় আর্থিক তথ্য অ্যাক্সেস করুন − আর্থিক শর্তাবলীতে সিদ্ধান্ত নেওয়ার সবচেয়ে সহজ উপায় হল সেই কাঁচা তথ্যগুলিকে বাড়ানো যা সাধারণত আর্থিক ডেটা ধারণ করার জন্য খনন করা হয়। কিছু সংস্থা বিনিয়োগ করছে এবং ডেটা গুদাম, এবং ডেটা মার্টের উন্নয়ন করছে।
একটি গুদাম বা মার্টের ডিজাইনে প্রত্যাশিত প্রশ্নের জন্য প্রয়োজনীয় বিশ্লেষণ এবং ডেটার ধরন সম্পর্কে বিবেচনা রয়েছে। এটি এমনভাবে গুদামগুলি ডিজাইন করছে যা আর্থিক তথ্যের অ্যাক্সেসের সাথে পণ্যের বৈশিষ্ট্য, ব্যবহারকারীর প্রোফাইল ইত্যাদির আরও সাধারণ ডেটা অ্যাক্সেস করার অনুমতি দেয়।
ডেটা মাইনিং মেট্রিক্সকে আর্থিক শর্তাবলীতে রূপান্তর করা হচ্ছে − একটি সাধারণ ডেটা মাইনিং মেট্রিক হল "লিফ্ট" এর পরিমাপ। লিফ্ট হল একটি পরিমাপ যা নির্দিষ্ট মডেল বা প্যাটার্ন ব্যবহার করে একটি বেস রেট যেখানে মডেলটি ব্যবহার করা হয় না তার সাথে সম্পর্কিত। উচ্চ মান মানে অনেক অর্জন করা হয়. তখন মনে হতে পারে যে কেউ লিফটের উপর ভিত্তি করে সিদ্ধান্ত নিতে পারে।
নির্ভুলতা − যথার্থতা হল সমর্থিত ডেটার বৈশিষ্ট্যগুলির সাথে মডেলটি কতটা ভাল ফলাফলের সম্পর্ক রাখে তার একটি পরিমাপ। নির্ভুলতার বিভিন্ন পরিমাপ আছে, তবে নির্ভুলতার সমস্ত পরিমাপ ব্যবহৃত তথ্যের উপর নির্ভরশীল। বাস্তবে, মানগুলি অনুপস্থিত বা আনুমানিক হতে পারে, বা ডেটা বিভিন্ন প্রক্রিয়া দ্বারা পরিবর্তিত হতে পারে৷
এটি অন্বেষণ এবং বিকাশের পদ্ধতি, এটি ডেটাতে একটি নির্দিষ্ট পরিমাণ ত্রুটি গ্রহণ করার সিদ্ধান্ত নিতে পারে, বিশেষ করে যদি ডেটা তার বৈশিষ্ট্যগুলির মধ্যে মোটামুটি অভিন্ন হয়। উদাহরণস্বরূপ, একটি মডেল যা অতীতের বিক্রয়ের উপর ভিত্তি করে একটি নির্দিষ্ট স্টোরের জন্য বিক্রয়ের পূর্বাভাস দেয় শক্তিশালীভাবে সম্পর্কযুক্ত এবং খুব সঠিক হতে পারে, এমনকি যদি সেই দোকানটি ধারাবাহিকভাবে ভুল অ্যাকাউন্টিং কৌশল ব্যবহার করে থাকে। সুতরাং, নির্ভুলতার পরিমাপ নির্ভরযোগ্যতার মূল্যায়ন দ্বারা ভারসাম্যপূর্ণ হওয়া উচিত।