কম্পিউটার

Apriori অ্যালগরিদমের জটিলতা কি?


Apriori অ্যালগরিদমের গণনাগত জটিলতা নিম্নলিখিত কারণগুলির দ্বারা প্রভাবিত হতে পারে যা নিম্নরূপ -

সহায়তা থ্রেশহোল্ড - সাপোর্ট থ্রেশহোল্ড কম করার ফলে উচ্চ আইটেমসেটগুলি ঘন ঘন হিসাবে বলা হচ্ছে। এটি অ্যালগরিদমের কম্পিউটেশনাল জটিলতার উপর একটি প্রতিকূল প্রভাব ফেলে কারণ উচ্চতর প্রার্থী আইটেমসেটগুলি তৈরি করা উচিত এবং গণনা করা উচিত৷

ঘন ঘন আইটেমসেটের সর্বাধিক আকার নিম্ন সমর্থন থ্রেশহোল্ডের সাথে উন্নতি করতেও প্রভাবিত করে। ঘন ঘন আইটেমসেটের সর্বাধিক আকারের উন্নতি হওয়ার সাথে সাথে ডেটা সেটের উপর দিয়ে আরও পাস তৈরি করতে অ্যালগরিদমের প্রয়োজন হবে৷

আইটেমের সংখ্যা (মাত্রিকতা) − বেশ কয়েকটি আইটেমের সংখ্যা বাড়ার সাথে সাথে আইটেমগুলির সমর্থন সংখ্যা সংরক্ষণ করতে আরও স্থানের প্রয়োজন হবে৷ যদি একাধিক ঘন ঘন আইটেমগুলি ডেটার মাত্রার সাথে বৃদ্ধি পায়, তবে অ্যালগরিদম দ্বারা উত্পাদিত প্রার্থী আইটেমসেটের সংখ্যা বেশি হওয়ার কারণে গণনা এবং I/O মান বৃদ্ধি পাবে৷

লেনদেনের সংখ্যা − Apriori-এর কারণে, অ্যালগরিদম ডেটাসেটের উপর বারবার পাস তৈরি করে, এর রান টাইম বেশি সংখ্যক লেনদেনের সাথে বৃদ্ধি পায়।

গড় লেনদেনের প্রস্থ − ঘন ডেটা সেটের জন্য, গড় লেনদেনের প্রস্থ বেশি হতে পারে। এটি দুটি পদ্ধতিতে অ্যাপরিওরি অ্যালগরিদমের জটিলতাকে প্রভাবিত করে যেমন ঘন ঘন আইটেমসেটের সর্বাধিক আকার বৃদ্ধির জন্য গড় লেনদেনের প্রস্থ বাড়ার সাথে সাথে প্রভাব ফেলে। লেনদেনের প্রস্থ বৃদ্ধি পায়, উচ্চতর আইটেমসেট লেনদেনে অন্তর্ভুক্ত করা হয়। এটি সমর্থন গণনার সময় বাস্তবায়িত একাধিক হ্যাশ ট্রি ট্রাভার্সাল বৃদ্ধি করবে৷

ঘন ঘন এল-আইটেমসেট তৈরি করা − প্রতিটি লেনদেনের জন্য, লেনদেনে উপস্থিত প্রতিটি আইটেমের জন্য সমর্থন গণনা আপডেট করতে হবে। বিবেচনা করে যে w গড় লেনদেনের প্রস্থ, এই অপারেশনটির জন্য O(Nw) সময়ের প্রয়োজন, যেখানে N হল মোট লেনদেনের সংখ্যা।

প্রার্থী প্রজন্ম − এটি প্রার্থী কে-আইটেমসেট তৈরি করতে পারে, ঘন ঘন জোড়া (k - 1)- আইটেমসেটগুলিকে একত্রিত করে সিদ্ধান্ত নেওয়া হয় যে তাদের মধ্যে ন্যূনতম k - 2টি আইটেম মিল আছে কিনা৷ প্রতিটি কম্বিনিং অপারেশনের জন্য সর্বাধিক k - 2 সমতা তুলনা প্রয়োজন। সর্বোত্তম ক্ষেত্রে, প্রতিটি একত্রিত পদক্ষেপ একটি কার্যকর প্রার্থী কে-আইটেমসেট তৈরি করে।

সবচেয়ে খারাপ পরিস্থিতিতে, অ্যালগরিদমের প্রতিটি জোড়া ঘন ঘন (k - 1)-আগের পুনরাবৃত্তিতে পাওয়া আইটেমসেটগুলিকে একত্রিত করা উচিত। তাই, ঘন ঘন আইটেমসেট একত্রিত করার সম্পূর্ণ খরচ হল

$$\mathrm{\displaystyle\sum\limits_{k=2}^w\:(k-2)|C_{k}|<\:Cost\:of\:merging\:<\displaystyle\sum\limits_ {k=2}^w\:(k-2)|F_{k}-1|^2}$$

প্রার্থীর আইটেমসেটগুলি সংরক্ষণ করতে প্রার্থী তৈরির সময় একটি হ্যাশ গাছও তৈরি করা হয়। গাছের সর্বাধিক গভীরতা k হওয়ার কারণে, প্রার্থীর আইটেমসেটগুলির সাথে হ্যাশ ট্রিকে বসানোর জন্য খরচ হল O($\mathrm{\displaystyle\sum\limits_{k=2}^w\:k|C_{k}| }$)।

প্রার্থী ছাঁটাই করার সময়, প্রতিটি প্রার্থীর কে-আইটেমসেটের k - 2 উপসেটগুলি ঘন ঘন হয় কিনা তা পরীক্ষা করতে হবে। যেহেতু হ্যাশ ট্রিতে একজন প্রার্থীকে দেখার খরচ হল O (k), প্রার্থী ছাঁটাই ধাপে O($\mathrm{\displaystyle\sum\limits_{k=2}^w\:k|C_{k} |}$) সময়।


  1. তথ্য নিরাপত্তা ডিইএস অ্যালগরিদম কি?

  2. ব্লোফিশ অ্যালগরিদমের অপারেশনগুলি কী কী?

  3. Blowfish এনক্রিপশন অ্যালগরিদম কি?

  4. তথ্য নিরাপত্তা RSA অ্যালগরিদম কি?