অ্যাসোসিয়েশন বিশ্লেষণ অ্যালগরিদমগুলিতে বিপুল সংখ্যক নিদর্শন তৈরি করার সম্ভাবনা রয়েছে। উদাহরণস্বরূপ, যদিও ডেটা সেটে শুধুমাত্র ছয়টি আইটেম অন্তর্ভুক্ত থাকে, তবে এটি নির্দিষ্ট সমর্থন এবং আত্মবিশ্বাসের থ্রেশহোল্ডে হাজার হাজার অ্যাসোসিয়েশন নিয়ম তৈরি করতে পারে। প্রকৃত আর্থিক ডেটাবেসগুলির আকার এবং মাত্রিকতা বড় হতে পারে, সেগুলি সহজেই হাজার হাজার বা এমনকি লক্ষ লক্ষ নিদর্শনগুলির সাথে শেষ হতে পারে, যার মধ্যে কিছু আকর্ষণীয় হতে পারে না৷
এটি নিদর্শনগুলির মাধ্যমে বিশ্লেষণাত্মক সবচেয়ে আকর্ষণীয়গুলি সনাক্ত করা একটি তুচ্ছ পরিষেবা নয় কারণ একজন ব্যক্তির আবর্জনা অন্য ব্যক্তির ধন হতে পারে। অ্যাসোসিয়েশন প্যাটার্নের গুণমান গণনার জন্য সু-স্বীকৃত পদ্ধতির একটি সেট তৈরি করা অপরিহার্য।
মানদণ্ডের প্রথম সেটটি পরিসংখ্যানগত যুক্তির মাধ্যমে তৈরি করা যেতে পারে। যে প্যাটার্নগুলি পারস্পরিকভাবে পৃথক আইটেমগুলির একটি গ্রুপ অন্তর্ভুক্ত করে বা বেশ কয়েকটি লেনদেন কভার করে সেগুলিকে আগ্রহহীন হিসাবে বিবেচনা করা হয় কারণ তারা ডেটাতে জাল অ্যাসোসিয়েশন নিতে পারে৷
এই ধরনের প্যাটার্নগুলি একটি উদ্দেশ্যমূলক আকর্ষণীয় অংশ ব্যবহার করে সরানো যেতে পারে যা একটি প্যাটার্ন আকর্ষণীয় কিনা তা নির্ধারণ করতে ডেটা থেকে প্রাপ্ত পরিসংখ্যান ব্যবহার করে। সমর্থন, আত্মবিশ্বাস এবং পারস্পরিক সম্পর্কের মতো উদ্দেশ্যমূলক আগ্রহের ব্যবস্থার উদাহরণ।
মানদণ্ডের দ্বিতীয় সেটটি বিষয়গত যুক্তির মাধ্যমে তৈরি করা যেতে পারে। একটি প্যাটার্নকে বিষয়গতভাবে অরুচিকর হিসাবে বিবেচনা করা হয় যদি না এটি ডেটা সম্পর্কে অপ্রত্যাশিত ডেটা স্বীকার না করে বা উপকারী জ্ঞানকে সমর্থন করে যা লাভজনক পরিষেবার দিকে পরিচালিত করতে পারে৷
উদাহরণস্বরূপ, উচ্চ সমর্থন এবং আত্মবিশ্বাসের মান নির্বিশেষে নিয়ম {Butter}→{Bread} আকর্ষণীয় হতে পারে না, কারণ নিয়ম দ্বারা সংজ্ঞায়িত সম্পর্ক বরং স্পষ্ট দেখা যেতে পারে।
অন্য পদে, নিয়ম {ডায়পার}}→{{বিয়ার} আকর্ষণীয় কারণ সম্পর্কটি অপ্রত্যাশিত এবং খুচরা বিক্রেতাদের জন্য একটি নতুন ক্রস-সেলিং ইভেন্টের পরামর্শ দিতে পারে৷ প্যাটার্ন গণনার মধ্যে বিষয়গত জ্ঞান অন্তর্ভুক্ত করা একটি জটিল কাজ কারণ এটির জন্য ডোমেন বিশেষজ্ঞদের কাছ থেকে যথেষ্ট পরিমাণে পূর্ববর্তী ডেটার প্রয়োজন হয়৷
প্যাটার্ন আবিষ্কারের টাস্কে পক্ষপাতদুষ্ট জ্ঞানকে অন্তর্ভুক্ত করার জন্য নিচের কয়েকটি পন্থা রয়েছে যা নিম্নরূপ -
ভিজ্যুয়ালাইজেশন - এই পদ্ধতির জন্য একটি ব্যবহারকারী-বান্ধব পরিবেশ প্রয়োজন যাতে লুপে মানব ব্যবহারকারী বজায় রাখা যায়। এটি ডোমেন বিশেষজ্ঞদের আবিষ্কৃত নিদর্শনগুলি সম্পাদন এবং পরীক্ষা করে ডেটা মাইনিং সিস্টেমের সাথে সংযোগ করতে সক্ষম করে৷
টেমপ্লেট-ভিত্তিক পদ্ধতি - এই পদ্ধতি ব্যবহারকারীদের মাইনিং অ্যালগরিদম দ্বারা অনুলিপি করা নিদর্শনগুলির ধরণকে সীমাবদ্ধ করতে সক্ষম করে৷ সমস্ত নিষ্কাশিত নিয়মগুলি নথিভুক্ত করার পরিবর্তে, শুধুমাত্র সেই নিয়মগুলি যেগুলির জন্য একটি ব্যবহারকারী-নির্দিষ্ট টেমপ্লেট প্রয়োজন ব্যবহারকারীদের কাছে পুনরুদ্ধার করা হয়৷
বিষয়ভিত্তিক আকর্ষণীয়তার পরিমাপ − একটি বিষয়গত পরিমাপ ডোমেন ডেটার উপর ভিত্তি করে উপস্থাপন করা যেতে পারে যার মধ্যে ধারণা শ্রেণিবিন্যাস বা উপাদানের লাভ সীমা অন্তর্ভুক্ত। পরিমাপটি প্যাটার্ন ফিল্টার করতে ব্যবহার করা যেতে পারে যেগুলি অ্যাক্সেসযোগ্য এবং অ-কার্যযোগ্য৷
৷