কম্পিউটার

Apriori অ্যালগরিদম কি?


Apriori হল একটি প্রাথমিক অ্যালগরিদম যা R. Agrawal এবং R. Srikant দ্বারা 1994 সালে বুলিয়ান অ্যাসোসিয়েশন নিয়মের জন্য ঘন ঘন আইটেম সেট তৈরি করা হয়েছিল। অ্যালগরিদম সেই ক্ষেত্রে নির্ভর করে যে অ্যালগরিদমের ঘন ঘন আইটেমসেট বৈশিষ্ট্যগুলির পূর্ববর্তী জ্ঞান প্রয়োজন৷

Apriori একটি পুনরাবৃত্ত পদ্ধতি ব্যবহার করে যার নাম একটি স্তর-ভিত্তিক অনুসন্ধান, যেখানে k-itemsets (k+1)-আইটেমসেটগুলি অন্বেষণ করতে পারে। প্রথমত, ঘন ঘন 1-আইটেমসেটের সেট প্রতিটি আইটেমের জন্য গণনা একত্রিত করার জন্য ডাটাবেস ব্রাউজ করে এবং ন্যূনতম সমর্থনকে সন্তুষ্ট করে এমন আইটেমগুলি গ্রহণ করে আবিষ্কৃত হয়। ফলস্বরূপ সেটটি নির্দেশিত হয় L1 .

পরবর্তী, L1 L2 খুঁজে পেতে পারেন , ঘন ঘন 2-আইটেমসেটের সেট, যা L3 খুঁজে পেতে পারে , ইত্যাদি, যতক্ষণ না আর ঘন ঘন k-itemsets আবিষ্কার করা যাবে না। প্রতিটি Lk এর সন্ধান ডাটাবেসের একটি সম্পূর্ণ স্ক্যান প্রয়োজন।

এটি ঘন ঘন আইটেমসেটের স্তর-ভিত্তিক প্রজন্মের কার্যকারিতা বাড়াতে পারে, একটি অপরিহার্য সম্পত্তি যা অ্যাপরিওরি সম্পত্তি নামে পরিচিত। এটি অনুসন্ধানের স্থান হ্রাস করতে পারে৷

Apriori সম্পত্তি − ঘন ঘন আইটেমসেটের কিছু খালি উপসেটও ঘন ঘন হওয়া উচিত।

Apriori সম্পত্তি নিম্নলিখিত পর্যবেক্ষণ উপর নির্ভর করে. বর্ণনা দ্বারা, যদি একটি আইটেমসেট আমি ন্যূনতম সমর্থন থ্রেশহোল্ড, মিনিম সাপ পূরণ না করে, তাহলে আমি ঘন ঘন নই; অর্থাৎ, P(I)

যদি একটি আইটেম A আইটেমসেট I তে ঢোকানো হয়, এইভাবে ফলস্বরূপ আইটেমসেট (অর্থাৎ, I ∪ A) I থেকে নিয়মিত উপস্থিত হতে পারে না। সুতরাং, I∪A ঘন ঘন হয় না যেমন P (I ∪ A)

এই বৈশিষ্ট্যটি অ্যান্টিমোনোটোন নামে পরিচিত বৈশিষ্ট্যগুলির একটি উপাদানের অন্তর্গত যে যদি একটি সেট একটি পরীক্ষা পরিবর্তন করতে না পারে, তবে কিছু সুপারসেট অনুরূপ পরীক্ষাকেও প্রত্যাখ্যান করবে। এটি অ্যান্টিমোনোটোন নামে পরিচিত কারণ একটি পরীক্ষা প্রত্যাখ্যান করার প্রেক্ষাপটে সম্পত্তিটি একঘেয়ে।

দুই-পদক্ষেপ প্রক্রিয়া অনুসরণ করা হয়, যোগদান এবং ছাঁটাই ক্রিয়া সহ যা নিম্নরূপ -

যোগদানের ধাপ − এটি Lk খুঁজে পেতে পারে , Lk যোগদানের মাধ্যমে প্রার্থী k-আইটেমসেটের একটি সেট তৈরি করা হয় −1 নিজের সাথে। প্রার্থীদের এই সেটটি Ck নির্দেশিত . L1 যাক এবং L2 Lk-এ আইটেমসেট হন −1। ডকুমেন্টেশন Li [j] Li-এ jth আইটেম সংজ্ঞায়িত করে (যেমন, L1 [k−2] L1-এ দ্বিতীয় থেকে শেষ আইটেমটিকে সংজ্ঞায়িত করে )।

ছাঁটাই ধাপ − Ck Lk এর একটি সুপারসেট , অর্থাৎ, এর সদস্যরা ঘন ঘন হতে পারে না, তবে কিছু ঘন ঘন কে-আইটেমসেট Ck-এর সাথে জড়িত থাকে . Ck-এ প্রতিটি প্রার্থীর গণনা নির্ধারণ করতে ডাটাবেসের একটি স্ক্যান Lk নির্ধারণ করতে পারে (অর্থাৎ, ন্যূনতম সমর্থন সংখ্যার চেয়ে কম নয় এমন কিছু প্রার্থীর বিবরণ ঘন ঘন হয়, এবং এইভাবে Lk এর অন্তর্গত ) Ck বড় হতে পারে, এবং এতে বড় গণনা অন্তর্ভুক্ত থাকতে পারে।


  1. জনপ্রিয় হ্যাশিং অ্যালগরিদম কি?

  2. তথ্য সুরক্ষায় SHA কী?

  3. ব্লোফিশ অ্যালগরিদমের অপারেশনগুলি কী কী?

  4. Blowfish এনক্রিপশন অ্যালগরিদম কি?