কম্পিউটার

জ্ঞান আবিষ্কারের একটি প্রক্রিয়া হিসাবে দেখা হলে ডেটা মাইনিংয়ে জড়িত পদক্ষেপগুলি কী কী?


KDD ডেটাবেসে জ্ঞান আবিষ্কারের প্রতিনিধিত্ব করে। এটি ডেটাতে জ্ঞান আবিষ্কারের বিস্তৃত প্রক্রিয়াকে সংজ্ঞায়িত করে এবং নির্দিষ্ট ডেটা মাইনিং কৌশলগুলির উচ্চ-স্তরের প্রয়োগের উপর জোর দেয়। এটি কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং, প্যাটার্ন স্বীকৃতি, ডেটাবেস, পরিসংখ্যান, পেশাদার সিস্টেমের জন্য জ্ঞান অর্জন এবং ডেটা ভিজ্যুয়ালাইজেশনের মতো বিভিন্ন ক্ষেত্রে গবেষকদের আগ্রহের একটি ক্ষেত্র৷

কেডিডি প্রক্রিয়ার মূল উদ্দেশ্য হল বিশাল ডাটাবেসের পরিপ্রেক্ষিতে তথ্য থেকে ডেটা বের করা। এটি ডেটা মাইনিং অ্যালগরিদম ব্যবহার করে যা জ্ঞান বলে বিবেচিত হয় তা চিনতে পারে৷

ডেটাবেসে নলেজ ডিসকভারি একটি প্রোগ্রামড, অনুসন্ধানমূলক বিশ্লেষণ এবং বিশাল ডেটা রিপোজিটরির মডেলিং হিসাবে বিবেচিত হয়। KDD হল বড় এবং কঠিন ডেটা সেট থেকে বৈধ, সহায়ক এবং বোধগম্য ডিজাইন শনাক্ত করার সংগঠিত প্রক্রিয়া।

ডেটা মাইনিং হল KDD পদ্ধতির মূল, যেমন অ্যালগরিদমগুলির অনুমান যা রেকর্ডগুলি তদন্ত করে, মডেল তৈরি করে এবং পূর্বে অজানা নিদর্শনগুলি আবিষ্কার করে। মডেলটি তথ্য থেকে জ্ঞান আহরণ, তথ্য বিশ্লেষণ এবং তথ্যের ভবিষ্যদ্বাণী করার জন্য ব্যবহৃত হয়।

ডেটা মাইনিং হল KDD প্রক্রিয়ার একটি ধাপ যাতে ডেটা বিশ্লেষণ এবং আবিষ্কারের অ্যালগরিদম প্রয়োগ করা হয় যা গ্রহণযোগ্য গণনাগত দক্ষতার সীমাবদ্ধতার অধীনে, ডেটার উপর নিদর্শনগুলির (বা মডেলগুলি) একটি নির্দিষ্ট গণনা করে৷

KDD প্রক্রিয়ায় কিছু প্রয়োজনীয় নির্বাচন, প্রিপ্রসেসিং, সাবস্যাম্পলিং এবং এর রূপান্তর সহ ডাটাবেস ব্যবহার করা থাকে; এটি থেকে নিদর্শন গণনা করার জন্য ডেটা-মাইনিং পদ্ধতি (অ্যালগরিদম) ব্যবহার করে; এবং গণনাকৃত নিদর্শনগুলির উপসেট চিনতে ডেটা মাইনিং এর পণ্যগুলি গণনা করা জ্ঞান হিসাবে বিবেচিত৷

জ্ঞান আবিষ্কার প্রক্রিয়ার সাথে জড়িত পদক্ষেপগুলি নিম্নরূপ -

  • নির্বাচন - ডেটা মাইনিং প্রক্রিয়ার জন্য প্রয়োজনীয় ডেটা বিভিন্ন উত্স থেকে সংগ্রহ করা হয়। অতএব, প্রথম ধাপ হল একটি ডেটাসেট বেছে নেওয়া বা ভেরিয়েবলের একটি উপসেট বা ডেটা নমুনার উপর ফোকাস করা যার উপর আবিষ্কার কার্যকর করা হবে৷
  • ডেটা ক্লিনিং এবং প্রিপ্রসেসিং − প্রক্রিয়ার দ্বারা ব্যবহার করা ডেটাতে অনুপস্থিত বা ভুল মান থাকতে পারে তাই মৌলিক ক্রিয়াকলাপগুলির মধ্যে রয়েছে শব্দ অপসারণ, মডেলের জন্য প্রয়োজনীয় তথ্য সংগ্রহ করা বা শব্দের জন্য অ্যাকাউন্ট, অনুপস্থিত ডেটা ক্ষেত্রগুলি পরিচালনা করার কৌশলগুলি নির্ধারণ করা, এবং সময়-ক্রমের জন্য অ্যাকাউন্টিং। তথ্য, KDD প্রক্রিয়ার দ্বিতীয় ধাপে সম্পন্ন হয়।
  • ডেটা রূপান্তর - এই ধাপে টাস্কের লক্ষ্যের উপর নির্ভর করে ডেটা উপস্থাপন করার জন্য দরকারী বৈশিষ্ট্যগুলি সন্ধান করা অন্তর্ভুক্ত। মাত্রিকতা হ্রাস বা রূপান্তর পদ্ধতির সাথে, বিবেচনাধীন ভেরিয়েবলের দক্ষ সংখ্যা হ্রাস করা যেতে পারে, বা ডেটার জন্য অপরিবর্তনীয় উপস্থাপনা আবিষ্কার করা যেতে পারে।
  • ডেটা মাইনিং − এটি ডেটা মাইনিং কাজ সম্পাদিত হওয়ার উপর ভিত্তি করে, এই ধাপটি রূপান্তরিত ডেটাতে একটি অ্যালগরিদম প্রয়োগ করে, একটি নির্দিষ্ট প্রতিনিধিত্বমূলক ফর্মে আগ্রহের প্যাটার্ন অনুসন্ধান করে বা শ্রেণিবিন্যাসের নিয়ম বা গাছ, রিগ্রেশন এবং ক্লাস্টারিং সহ নির্দিষ্ট উপস্থাপনাগুলির একটি সেট।
  • খনন করা নিদর্শন ব্যাখ্যা করা − এই ধাপে এক্সট্রাক্ট করা প্যাটার্ন এবং মডেলের ভিজ্যুয়ালাইজেশন বা এক্সট্র্যাক্ট করা মডেলে প্রদত্ত ডেটার ভিজ্যুয়ালাইজেশন জড়িত থাকতে পারে।

  1. ডাটা মাইনিং এ OLAP টুল কি কি?

  2. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  3. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?

  4. ডেটা মাইনিংয়ে আউটলায়ারের ধরন কী কী?