কম্পিউটার

FP-বৃক্ষের প্রতিনিধিত্ব কি?


একটি এফপি-ট্রি হল ইনপুট ডেটার একটি কঠিন বিবরণ। এটি একবারে একটি লেনদেনের ডেটা সেট পড়ার মাধ্যমে এবং FP-ট্রিতে একটি রুটে প্রতিটি লেনদেন পরিমাপ করে একত্রিত হয়। বেশ কিছু লেনদেনে একাধিক আইটেম মিল থাকতে পারে, তাদের রুট ওভারল্যাপ হতে পারে।

রুটগুলি একে অপরের সাথে যত বেশি ওভারল্যাপ করবে, FP-ট্রি আর্কিটেকচার ব্যবহার করে তত বেশি সংকোচন করা যাবে। যদি FP-ট্রির আকার প্রধান মেমরিতে ফিট করার জন্য পর্যাপ্ত হয়, তাহলে এটি আমাদের ডিস্কে সংরক্ষিত ডেটার উপর বারবার পাস তৈরি করার পরিবর্তে মেমরির আর্কিটেকচার থেকে সরাসরি ঘন ঘন আইটেমসেটগুলি বের করতে সক্ষম করবে।

গাছের প্রতিটি নোডে একটি কাউন্টারের সাথে একটি আইটেমের লেবেল রয়েছে যা প্রদত্ত রুটে ম্যাপ করা একাধিক লেনদেন প্রদর্শন করে। মূলত, এফপি-ট্রিতে শুধুমাত্র নালফ চিহ্ন দ্বারা সংজ্ঞায়িত রুট নোড অন্তর্ভুক্ত থাকে।

FP-ট্রি নিম্নলিখিত পদ্ধতিতে চলতে থাকে যা নিম্নরূপ -

প্রতিটি আইটেমের সমর্থন সংখ্যা নির্ধারণ করার জন্য ডেটা সেটটি একবার অনুসন্ধান করা হয়। বিরল আইটেমগুলি বাদ দেওয়া হয়, যখন ঘন ঘন আইটেমগুলি সমর্থনের সংখ্যা হ্রাস করে৷

অ্যালগরিদম FP ট্রি তৈরি করতে ডেটার উপর দ্বিতীয় পাস তৈরি করে। প্রথম লেনদেন পর্যালোচনা করার পরে, {a, b}, a এবং b হিসাবে লেবেলযুক্ত নোডগুলি তৈরি করা হয়৷ লেনদেন এনক্রিপ্ট করতে নাল→a→b থেকে একটি পাথ তৈরি করা হয়। রুট বরাবর প্রতিটি নোডের ফ্রিকোয়েন্সি কাউন্ট 1।

দ্বিতীয় লেনদেন পর্যালোচনা করার পর, {b, c, d}, আইটেম b, c, এবং d এর জন্য নোডের একটি নতুন সেট তৈরি করা হয়। নোড নাল→b→c→d

লিঙ্ক করে লেনদেন সংজ্ঞায়িত করার জন্য একটি রুট তৈরি করা হয়।

এই রুটের প্রতিটি নোডের একটি ফ্রিকোয়েন্সি গণনা একটির সমান। যদিও প্রথম দুটি লেনদেনের একটি আইটেম ঘন ঘন থাকে, যা b, তাদের রুটগুলি বিচ্ছিন্ন হয় কারণ লেনদেনগুলি ঘন ঘন উপসর্গ ভাগ করে না৷

তৃতীয় লেনদেন, {a, c, d, e}, প্রথম লেনদেনের সাথে একটি ঘন ঘন উপসর্গ আইটেম (যা a) ভাগ করে। তদনুসারে, তৃতীয় লেনদেনের রুট, নাল→a→ c →d→e, প্রথম লেনদেনের রুটের সাথে ওভারল্যাপ করে, nuII→a→b। তাদের ওভারল্যাপিং রুটের কারণে, নোড o-এর ফ্রিকোয়েন্সি গণনা দুটিতে বৃদ্ধি করা হয়েছে, যখন সম্প্রতি তৈরি করা নোডগুলির জন্য ফ্রিকোয়েন্সি গণনা, c, d, এবং e একই।

প্রতিটি লেনদেন FP-ট্রিতে দেওয়া রুটের একটিতে ম্যাপ করা না হওয়া পর্যন্ত এই ধাপটি চলতে থাকে। একটি এফপি-ট্রির আকার অসংকুচিত ডেটার আকারের চেয়ে ছোট কারণ বাজারের ঝুড়ি তথ্যে বেশ কয়েকটি লেনদেন সাধারণ জিনিসগুলি ভাগ করে নেয়৷


  1. ডেটা মাইনিং এর সীমাবদ্ধতা কি কি?

  2. ডেটা মাইনিং এর টুল কি কি?

  3. সি টোকেন কি?

  4. C# এ মন্তব্য কি?