কম্পিউটার

ডেটা মাইনিং এর তাত্ত্বিক ভিত্তি কি?


ডেটা মাইনিংয়ের ভিত্তির জন্য কয়েকটি তত্ত্ব রয়েছে যার মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত রয়েছে -

ডেটা হ্রাস − এই তত্ত্বে, ডেটা মাইনিংয়ের ভিত্তি হল ডেটা উপস্থাপনা কমানো। বিশাল ডাটাবেসের প্রশ্নের দ্রুত আনুমানিক উত্তর প্রাপ্ত করার প্রয়োজনের প্রতিক্রিয়া হিসাবে ডেটা হ্রাস গতির জন্য নিশ্চিততা লেনদেন করে।

ডেটা হ্রাস পদ্ধতিগুলির মধ্যে একক মান পচন (প্রধান উপাদান বিশ্লেষণের পিছনে ড্রাইভিং উপাদান), তরঙ্গ, রিগ্রেশন, লগ-লিনিয়ার মডেল, হিস্টোগ্রাম, ক্লাস্টারিং, স্যাম্পলিং এবং সূচক গাছের বিকাশ অন্তর্ভুক্ত।

ডেটা কম্প্রেশন − এই তত্ত্ব অনুসারে, ডেটা মাইনিং-এর ভিত্তি হল বিট, অ্যাসোসিয়েশন নিয়ম, সিদ্ধান্ত গাছ, ক্লাস্টার ইত্যাদির পরিপ্রেক্ষিতে এনকোডিং করে প্রদত্ত তথ্যকে সংকুচিত করা৷

প্যাটার্ন আবিষ্কার৷ − এই তত্ত্বে, ডেটা মাইনিং-এর ভিত্তি হল অ্যাসোসিয়েশন, শ্রেণীবিভাগের মডেল, অনুক্রমিক নিদর্শন ইত্যাদি সহ ডাটাবেসে প্রদর্শিত নিদর্শনগুলি খুঁজে বের করা৷ মেশিন লার্নিং, নিউরাল নেটওয়ার্ক, অ্যাসোসিয়েশন মাইনিং, অনুক্রমিক প্যাটার্ন মাইনিং, ক্লাস্টারিং, সহ বিভিন্ন ক্ষেত্র রয়েছে৷ এবং বিভিন্ন সাবফিল্ড এই তত্ত্বে অবদান রাখে।

সম্ভাব্যতা তত্ত্ব - এটি পরিসংখ্যান তত্ত্বের উপর ভিত্তি করে। এই তত্ত্বে, ডেটা মাইনিং এর ভিত্তি হল র্যান্ডম ভেরিয়েবলের যৌথ সম্ভাব্যতা বন্টন খুঁজে বের করা, উদাহরণস্বরূপ, বায়েসিয়ান বিশ্বাস নেটওয়ার্ক বা শ্রেণীবিন্যাস বায়েসিয়ান মডেল।

মাইক্রোইকোনমিক ভিউ − মাইক্রোইকোনমিক ভিউ ডেটা মাইনিংকে প্যাটার্নগুলি আবিষ্কারের পরিষেবা হিসাবে বিবেচনা করে যেগুলি কেবলমাত্র কিছু এন্টারপ্রাইজের সিদ্ধান্ত গ্রহণের পদ্ধতিতে ব্যবহার করা যেতে পারে (যেমন, বিপণন পদ্ধতি এবং উত্পাদন পরিকল্পনা সম্পর্কে)।

এই দৃষ্টিভঙ্গি পরিষেবাগুলির মধ্যে একটি, যার উপর ভিত্তি করে নিদর্শনগুলি আকর্ষণীয় বলে বিবেচিত হয়। এন্টারপ্রাইজগুলিকে অপ্টিমাইজেশান সমস্যাগুলির সম্মুখীন হিসাবে বিবেচনা করা হয়, যেখানে উদ্দেশ্যটি একটি সিদ্ধান্তের পরিষেবা বা মূল্যকে সর্বাধিক করা। এই তত্ত্বে, ডেটা মাইনিং একটি অরৈখিক অপ্টিমাইজেশন সমস্যা হয়ে ওঠে।

ইন্ডাকটিভ ডাটাবেস − এই তত্ত্ব অনুসারে, একটি ডাটাবেস স্কিমা ডেটাবেসে সংরক্ষিত ডেটা এবং প্যাটার্নগুলিকে অন্তর্ভুক্ত করে। ডেটা মাইনিং হল ডাটাবেসগুলিতে আনয়ন বাস্তবায়নের সমস্যা, যেখানে কাজটি ডেটাবেসের তথ্য এবং তত্ত্ব (অর্থাৎ, নিদর্শন) অনুসন্ধান করা। এই দৃষ্টিভঙ্গি ডাটাবেস সিস্টেমে বেশ কয়েকজন গবেষকের মধ্যে বিখ্যাত।

এই তত্ত্বগুলি যৌথভাবে একচেটিয়া নয়। উদাহরণস্বরূপ, প্যাটার্ন আবিষ্কারকে ডেটা হ্রাস বা ডেটা সংকোচনের একটি নকশা হিসাবেও দেখা যেতে পারে। আদর্শভাবে, একটি তাত্ত্বিক কাঠামো অবশ্যই সাধারণ ডেটা মাইনিং কাজগুলিকে মডেল করতে সক্ষম হতে হবে (সংযোগ, শ্রেণিবিন্যাস এবং ক্লাস্টারিং সহ), একটি সম্ভাব্য বৈশিষ্ট্য থাকতে হবে, বিভিন্ন ধরণের ডেটা পরিচালনা করতে সক্ষম হবে এবং ডেটা মাইনিংয়ের পুনরাবৃত্তিমূলক এবং ইন্টারেক্টিভ সারাংশকে চিকিত্সা করতে হবে। তাছাড়া ডেটা মাইনিংয়ের জন্য একটি সু-সংজ্ঞায়িত কাঠামো প্রতিষ্ঠার জন্য প্রচেষ্টার প্রয়োজন, যা এই প্রয়োজনীয়তাগুলিকে সন্তুষ্ট করে৷


  1. টেক্সট মাইনিং এর প্রয়োজন কি?

  2. ডেটা মাইনিংয়ে ঐতিহাসিক তথ্য কি?

  3. ডেটা মাইনিং ইন্টারফেস কি?

  4. টেম্পোরাল ডেটা মাইনিং কি?