কম্পিউটার

ডেটা মাইনিং এর কার্যকারিতা কি?


ডেটা মাইনিং কার্যকারিতাগুলি ডেটা মাইনিং কার্যগুলিতে যে ধরণগুলি আবিষ্কার করতে হবে তা উপস্থাপন করতে ব্যবহৃত হয়। সাধারণভাবে, ডেটা মাইনিং কাজগুলিকে বর্ণনামূলক এবং ভবিষ্যদ্বাণীমূলক সহ দুটি প্রকারে শ্রেণীবদ্ধ করা যেতে পারে। বর্ণনামূলক খনির কাজগুলি ডাটাবেসের ডেটার সাধারণ বৈশিষ্ট্যগুলিকে সংজ্ঞায়িত করে এবং ভবিষ্যদ্বাণীমূলক খনির কাজগুলি ভবিষ্যদ্বাণীগুলি বিকাশের জন্য বর্তমান তথ্যের উপর ভিত্তি করে৷

বিভিন্ন ডেটা মাইনিং কার্যকারিতা রয়েছে যা নিম্নরূপ -

  • ডেটা চরিত্রায়ন - এটি একটি অবজেক্ট ক্লাস ডেটার সাধারণ বৈশিষ্ট্যগুলির সংক্ষিপ্তসার। ব্যবহারকারী-নির্দিষ্ট শ্রেণীর সাথে সম্পর্কিত ডেটা সাধারণত একটি ডাটাবেস ক্যোয়ারী দ্বারা সংগ্রহ করা হয়। ডেটা ক্যারেক্টারাইজেশনের আউটপুট একাধিক ফর্মে উপস্থাপিত হতে পারে।

  • ডেটা বৈষম্য − এটি লক্ষ্য শ্রেণীর ডেটা অবজেক্টের সাধারণ বৈশিষ্ট্যগুলির সাথে একটি বা বৈপরীত্য ক্লাসের একটি সেটের বস্তুর সাধারণ বৈশিষ্ট্যগুলির সাথে তুলনা করা হয়। লক্ষ্য এবং বৈপরীত্য শ্রেণীগুলি ব্যবহারকারীর দ্বারা উপস্থাপিত হতে পারে, এবং সমতুল্য ডেটা অবজেক্টগুলি ডেটাবেস কোয়েরির মাধ্যমে আনা হয়৷

  • অ্যাসোসিয়েশন বিশ্লেষণ - এটি আইটেমগুলির সেট বিশ্লেষণ করে যা সাধারণত একটি লেনদেন ডেটাসেটে একসাথে ঘটে। দুটি পরামিতি রয়েছে যা অ্যাসোসিয়েশন নিয়ম নির্ধারণের জন্য ব্যবহৃত হয় −

    • এটি সরবরাহ করে যা ডাটাবেসে সেট করা সাধারণ আইটেমটিকে সনাক্ত করে৷

    • আত্মবিশ্বাস হল শর্তসাপেক্ষ সম্ভাব্যতা যে একটি আইটেম একটি লেনদেনে ঘটে যখন অন্য একটি আইটেম ঘটে।

  • শ্রেণীবিন্যাস − শ্রেণীবিভাগ হল এমন একটি মডেল আবিষ্কার করার পদ্ধতি যা উপাত্তের শ্রেণী বা ধারণার প্রতিনিধিত্ব করে এবং আলাদা করে, মডেল ব্যবহার করে বস্তুর শ্রেণী ভবিষ্যদ্বাণী করতে সক্ষম হওয়ার উদ্দেশ্যে যার শ্রেণী লেবেল বেনামী। প্রাপ্ত মডেলটি প্রশিক্ষণ ডেটার একটি সেটের বিশ্লেষণের উপর প্রতিষ্ঠিত হয় (অর্থাৎ, ডেটা অবজেক্ট যার ক্লাস লেবেল সাধারণ)।

  • ভবিষ্যদ্বাণী - এটি কিছু অনুপলব্ধ ডেটা মান বা মুলতুবি প্রবণতা পূর্বাভাস সংজ্ঞায়িত করে। অবজেক্টের অ্যাট্রিবিউট মান এবং ক্লাসের অ্যাট্রিবিউট মানের উপর ভিত্তি করে একটি অবজেক্ট অনুমান করা যেতে পারে। এটি অনুপস্থিত সংখ্যাসূচক মান বা সময়-সম্পর্কিত তথ্যের প্রবণতা বৃদ্ধি/কমানোর পূর্বাভাস হতে পারে।

  • ক্লাস্টারিং - এটি শ্রেণীবিভাগের অনুরূপ কিন্তু শ্রেণীগুলি পূর্বনির্ধারিত নয়। ক্লাসগুলি ডেটা বৈশিষ্ট্য দ্বারা উপস্থাপিত হয়। এটি একটি তত্ত্বাবধানহীন শিক্ষা। বস্তুগুলি ক্লাস্টার বা গোষ্ঠীবদ্ধ, ইন্ট্রাক্লাস সাদৃশ্য সর্বাধিক করার নীতির উপর নির্ভর করে এবং ইন্ট্রাক্লাস সাদৃশ্য কমিয়ে দেয়৷

  • বাহ্যিক বিশ্লেষণ − Outliers হল ডেটা উপাদান যা একটি প্রদত্ত শ্রেণী বা ক্লাস্টারে গোষ্ঠীভুক্ত করা যায় না। এই ডেটা অবজেক্ট যা অন্যান্য ডেটা অবজেক্টের সাধারণ আচরণ থেকে একাধিক আচরণ করে। এই ধরনের তথ্য বিশ্লেষণ জ্ঞান খনি অপরিহার্য হতে পারে.

  • বিবর্তন বিশ্লেষণ − এটি বস্তুর প্রবণতাকে সংজ্ঞায়িত করে যার আচরণ কিছু সময়ের সাথে পরিবর্তিত হয়।


  1. ডেটা মাইনিংয়ে ওএলএপি অপারেশনগুলি কী কী?

  2. ডাটা মাইনিং এ OLAP টুল কি কি?

  3. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  4. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?