কম্পিউটার

লেনদেন ডাটাবেস থেকে খনির মাল্টিলেভেল অ্যাসোসিয়েশন নিয়ম কি?


মাইনিং মাল্টিলেভেল অ্যাসোসিয়েশন নিয়মের পন্থাগুলি সাপোর্ট কনফিডেন্স ফ্রেমওয়ার্কের উপর ভিত্তি করে। টপ-ডাউন কৌশলটি নিযুক্ত করা হয় যেখানে প্রতিটি কনসেপ্ট লেভেলে ঘন ঘন আইটেমসেটের গণনার জন্য গণনা জমা করা হয়, কনসেপ্ট লেভেল 1 থেকে শুরু হয় এবং অ্যাপরিওরি অ্যালগরিদম ব্যবহার করে আরও ঘন ঘন আইটেমসেট পাওয়া না যাওয়া পর্যন্ত নিম্ন নির্দিষ্ট কনসেপ্ট লেভেলের দিকে কাজ করা হয়।

ডেটার মধ্যে নিম্ন-স্তরের ধারণাগুলিকে তাদের উচ্চ-স্তরের ধারণা বা একটি ধারণা শ্রেণিবিন্যাস থেকে পূর্বপুরুষদের সাথে প্রতিস্থাপন করে ডেটাকে সাধারণীকরণ করা যেতে পারে। একটি ধারণা শ্রেণিবিন্যাসে, যা একটি গাছ হিসাবে উপস্থাপিত হয় যার মূলটি D হিসাবে থাকে, যেমন টাস্ক-প্রাসঙ্গিক ডেটা৷

মাল্টি-লেভেল অ্যাসোসিয়েশনের জন্য আবেদনের জনপ্রিয় ক্ষেত্র হল বাজারের ঝুড়ি বিশ্লেষণ, যা গ্রাহকদের ক্রয় অভ্যাসগুলি অধ্যয়ন করে যেগুলি প্রায়শই কেনা হয়, একত্রে কেনা আইটেমগুলির সেটগুলি অনুসন্ধান করে যা ধারণা শ্রেণিবিন্যাসের ধারণায় প্রদর্শিত হয়েছিল৷

প্রতিটি নোড একটি আইটেম বা আইটেম সেট নির্দেশ করে যা পরীক্ষা করা হয়েছে। বিমূর্তকরণের যেকোনো স্তরে ঘন ঘন আইটেমসেটগুলি খুঁজে পাওয়ার জন্য বিভিন্ন পদ্ধতি রয়েছে। কিছু পদ্ধতি যা ব্যবহার করা হচ্ছে তা হল 'সমস্ত স্তরের জন্য অভিন্ন ন্যূনতম সমর্থন ব্যবহার করা', নিম্ন স্তরে সর্বনিম্ন সমর্থন হ্রাস করা, স্তরে স্তরে স্বাধীন।

মাল্টি-লেভেল ডাটাবেসের জন্য প্রাথমিক লেনদেন টেবিলের পরিবর্তে একটি হায়ারার্কি-ডেটা এনকোডেড লেনদেন টেবিল প্রয়োজন। এটি উপযোগী হয় যখন আমরা সমস্ত আইটেমের পরিবর্তে লেনদেন ডাটাবেসের শুধুমাত্র একটি অংশ যেমন খাবারে আগ্রহী হই। এইভাবে আমরা প্রথমে ডেটার প্রাসঙ্গিক সেট সংগ্রহ করতে পারি এবং তারপর টাস্ক-প্রাসঙ্গিক সেটে বারবার কাজ করতে পারি। এইভাবে লেনদেন সারণীতে, প্রতিটি আইটেম অঙ্কের ক্রম হিসাবে এনকোড করা হয়৷

সমস্ত স্তরের জন্য অভিন্ন ন্যূনতম সমর্থন ব্যবহার করা − যখন একটি অভিন্ন সর্বনিম্ন সমর্থন থ্রেশহোল্ড ব্যবহার করা হয়, অনুসন্ধান পদ্ধতি সরলীকৃত হয়। একটি অপ্টিমাইজেশান কৌশল অবলম্বন করা যেতে পারে, এই জ্ঞানের উপর ভিত্তি করে যে একজন পূর্বপুরুষ তার বংশধরদের একটি সুপারসেট, অনুসন্ধানটি এমন কোনও আইটেম ধারণকারী আইটেমসেটগুলি পরীক্ষা করা এড়িয়ে যায় যার পূর্বপুরুষের ন্যূনতম সমর্থন নেই৷

অভিন্ন সমর্থন পদ্ধতির প্রধান ত্রুটি হল যে বিমূর্তকরণের নিম্ন স্তরের আইটেমগুলি বিমূর্ততার উচ্চ স্তরেরগুলির মতো ঘন ঘন ঘটবে৷

নিম্ন স্তরে হ্রাসকৃত সর্বনিম্ন সমর্থন ব্যবহার করা - বিমূর্ততার প্রতিটি স্তরের ন্যূনতম সমর্থন থ্রেশহোল্ড রয়েছে। বিমূর্ততা স্তর যত কম হবে, সমতুল্য থ্রেশহোল্ড তত ছোট হবে। হ্রাসকৃত সমর্থন সহ খনির একাধিক-স্তরের অ্যাসোসিয়েশনের জন্য নিম্নলিখিত অনুসন্ধান বিভাগগুলি হল −

  • পর্যায়ক্রমে স্বাধীন - এটি একটি সম্পূর্ণ প্রশস্ত অনুসন্ধান, ঘন ঘন আইটেমসেটের পটভূমি জ্ঞান ছাঁটাইয়ের জন্য ব্যবহৃত হয়। এখানে প্রতিটি নোড পরীক্ষা করা হয় নির্বিশেষে প্যারেন্ট নোড ঘন ঘন পাওয়া যায়।

  • একটি আইটেম দ্বারা স্তর ক্রস-ফিল্টারিং − ith স্তর হিসাবে একটি আইটেম নির্ধারিত হয় যদি এবং শুধুমাত্র যদি (i-1)তম স্তরে এর প্যারেন্ট নোড ঘন ঘন হয়৷

  • কে-আইটেমসেট দ্বারা লেভেল ক্রস-ফিল্টারিং − ith স্তরে একটি আইটেমসেট নির্ধারিত হয় যদি এবং শুধুমাত্র যদি (i-1)তম স্তরে তার সমতুল্য অভিভাবক A-আইটেমসেট ঘন ঘন হয়৷


  1. ডেটা মাইনিং ইন্টারফেস কি?

  2. ওয়েব ব্যবহার মাইনিং এর নিয়ম কি?

  3. ওয়েব মাইনিংয়ের অ্যাপ্লিকেশনগুলি কী কী?

  4. অ্যাট্রিবিউট সাধারণীকরণের নিয়মগুলি কী কী?