কম্পিউটার

ক্ষতিকারক গণনা অ্যালগরিদম কীভাবে ঘন ঘন আইটেম খুঁজে পায়?


একজন ব্যবহারকারী ন্যূনতম সমর্থন থ্রেশহোল্ড সহ দুটি ইনপুট প্যারামিটার সমর্থন করে, σ, এবং পূর্বে আবদ্ধ ত্রুটি, ε হিসাবে নির্দেশিত। আগত স্ট্রীমটি তাত্ত্বিকভাবে w =[1/ε] প্রস্থের বালতিতে বিভক্ত।

N কে বর্তমান স্ট্রীম দৈর্ঘ্য হিসাবে ধরুন, অর্থাৎ, এখন পর্যন্ত আইটেম দেখার সংখ্যা। অ্যালগরিদমের ০-এর বেশি ফ্রিকোয়েন্সি সহ সমস্ত উপাদানের জন্য একটি ফ্রিকোয়েন্সি-তালিকা ডেটা কাঠামো প্রয়োজন। প্রতিটি আইটেমের জন্য, তালিকা f, আনুমানিক ফ্রিকোয়েন্সি গণনা এবং ∆, f-এর সর্বাধিক সম্ভাব্য ত্রুটি সমর্থন করে।

নিম্নরূপ আইটেম অ্যালগরিদম পদ্ধতি buckets. যখন একটি নতুন বালতি আসে, তখন বালতির আইটেমগুলি ফ্রিকোয়েন্সি তালিকায় ঢোকানো হয়। একটি প্রদত্ত আইটেম তালিকায় বিদ্যমান থাকলে, এটি কেবল তার ফ্রিকোয়েন্সি সংখ্যা বৃদ্ধি করতে পারে, f. অন্যথায়, এটি 1 এর ফ্রিকোয়েন্সি গণনার সাথে তালিকায় এটি যোগ করতে পারে। যদি নতুন আইটেমটি bth বালতি থেকে হয়, তাহলে এটি ∆ সেট করতে পারে, আইটেমের ফ্রিকোয়েন্সি গণনায় সর্বাধিক সম্ভাব্য বাগ, b−1 হতে পারে।

যখনই একটি বালতি সীমানা অর্জিত হয় (অর্থাৎ, N, w, 2w, 3w, ইত্যাদি সহ w এর একাধিক প্রস্থে পৌঁছেছে), ফ্রিকোয়েন্সি তালিকা নির্ধারণ করা হয়। ধরা যাক b বর্তমান বালতি সংখ্যা। একটি আইটেম এন্ট্রি মুছে ফেলা হয় যদি, সেই এন্ট্রির জন্য, f + ∆ ≤ b। এই পদ্ধতিতে, অ্যালগরিদমের উদ্দেশ্য হল ফ্রিকোয়েন্সি তালিকা ছোট রাখা যাতে এটি প্রাথমিক মেমরিতে ফিট করতে পারে। প্রতিটি আইটেমের জন্য সংরক্ষিত ফ্রিকোয়েন্সি গণনাটি আইটেমের আসল ফ্রিকোয়েন্সি হবে বা এটিকে ছোট করা হবে।

আনুমানিক অ্যালগরিদমের অপরিহার্য কারণ হল আনুমানিক অনুপাত (বা ত্রুটি আবদ্ধ)। আসুন কেসটি দেখি যেখানে একটি আইটেম সরানো হয়। এটি প্রদর্শিত হয় যখন একটি আইটেমের জন্য f +∆ ≤ b হয়, যেখানে b হল বর্তমান বালতি নম্বর৷

এটি বুঝতে পারে যে b ≤ N/w, অর্থাৎ, b ≤ εN। একটি আইটেমের আসল ফ্রিকোয়েন্সি সর্বাধিক f+∆। অতএব, একটি আইটেম ছোট করা যেতে পারে εN. যদি এই আইটেমের প্রকৃত সমর্থন σ হয় (এটি ঘন ঘন চিকিত্সা করার জন্য এটি সর্বনিম্ন সমর্থন বা নিম্ন আবদ্ধ), তাই প্রকৃত ফ্রিকোয়েন্সি σN, এবং ফ্রিকোয়েন্সি, f, ফ্রিকোয়েন্সি তালিকায় সর্বনিম্ন হওয়া উচিত (σN −εN )।

তাই, যদি আমরা ফ্রিকোয়েন্সি তালিকার সমস্ত আইটেম আউটপুট করি যার f মান ন্যূনতম (σN −εN), তাই কিছু ঘন ঘন আইটেম আউটপুট হবে। তাছাড়া, কিছু সাবফ্রিকেন্ট আইটেম (সর্বনিম্ন σN −εN এর প্রকৃত ফ্রিকোয়েন্সি সহ কিন্তু σN এর কম) আউটপুট হবে।


  1. কীভাবে একটি নেটওয়ার্ক প্রিন্টারের আইপি ঠিকানা খুঁজে পাবেন

  2. কিভাবে 5GHz ফ্রিকোয়েন্সির জন্য সেরা Wi-Fi চ্যানেল খুঁজে বের করবেন

  3. YouTube অ্যালগরিদম কীভাবে কাজ করে?

  4. Windows 11 PC এ IP ঠিকানা কীভাবে খুঁজে পাবেন