কম্পিউটার

সমিতি নিদর্শন মূল্যায়ন কি?


অ্যাসোসিয়েশন বিশ্লেষণ অ্যালগরিদমগুলিতে বিপুল সংখ্যক নিদর্শন তৈরি করার সম্ভাবনা রয়েছে। উদাহরণস্বরূপ, যদিও ডেটা সেটে শুধুমাত্র ছয়টি আইটেম অন্তর্ভুক্ত থাকে, তবে এটি নির্দিষ্ট সমর্থন এবং আত্মবিশ্বাসের থ্রেশহোল্ডে হাজার হাজার অ্যাসোসিয়েশন নিয়ম তৈরি করতে পারে। প্রকৃত আর্থিক ডেটাবেসগুলির আকার এবং মাত্রিকতা বড় হতে পারে, সেগুলি সহজেই হাজার হাজার বা এমনকি লক্ষ লক্ষ নিদর্শনগুলির সাথে শেষ হতে পারে, যার মধ্যে কিছু আকর্ষণীয় হতে পারে না৷

এটি নিদর্শনগুলির মাধ্যমে বিশ্লেষণাত্মক সবচেয়ে আকর্ষণীয়গুলি সনাক্ত করা একটি তুচ্ছ পরিষেবা নয় কারণ একজন ব্যক্তির আবর্জনা অন্য ব্যক্তির ধন হতে পারে। অ্যাসোসিয়েশন প্যাটার্নের গুণমান গণনার জন্য সু-স্বীকৃত পদ্ধতির একটি সেট তৈরি করা অপরিহার্য।

মানদণ্ডের প্রথম সেটটি পরিসংখ্যানগত যুক্তির মাধ্যমে তৈরি করা যেতে পারে। যে প্যাটার্নগুলি পারস্পরিকভাবে পৃথক আইটেমগুলির একটি গ্রুপ অন্তর্ভুক্ত করে বা বেশ কয়েকটি লেনদেন কভার করে সেগুলিকে আগ্রহহীন হিসাবে বিবেচনা করা হয় কারণ তারা ডেটাতে জাল অ্যাসোসিয়েশন নিতে পারে৷

এই ধরনের প্যাটার্নগুলি একটি উদ্দেশ্যমূলক আকর্ষণীয় অংশ ব্যবহার করে সরানো যেতে পারে যা একটি প্যাটার্ন আকর্ষণীয় কিনা তা নির্ধারণ করতে ডেটা থেকে প্রাপ্ত পরিসংখ্যান ব্যবহার করে। সমর্থন, আত্মবিশ্বাস এবং পারস্পরিক সম্পর্কের মতো উদ্দেশ্যমূলক আগ্রহের ব্যবস্থার উদাহরণ।

মানদণ্ডের দ্বিতীয় সেটটি বিষয়গত যুক্তির মাধ্যমে তৈরি করা যেতে পারে। একটি প্যাটার্নকে বিষয়গতভাবে অরুচিকর হিসাবে বিবেচনা করা হয় যদি না এটি ডেটা সম্পর্কে অপ্রত্যাশিত ডেটা স্বীকার না করে বা উপকারী জ্ঞানকে সমর্থন করে যা লাভজনক পরিষেবার দিকে পরিচালিত করতে পারে৷

উদাহরণস্বরূপ, উচ্চ সমর্থন এবং আত্মবিশ্বাসের মান নির্বিশেষে নিয়ম {Butter}→{Bread} আকর্ষণীয় হতে পারে না, কারণ নিয়ম দ্বারা সংজ্ঞায়িত সম্পর্ক বরং স্পষ্ট দেখা যেতে পারে।

অন্য পদে, নিয়ম {ডায়পার}}→{{বিয়ার} আকর্ষণীয় কারণ সম্পর্কটি অপ্রত্যাশিত এবং খুচরা বিক্রেতাদের জন্য একটি নতুন ক্রস-সেলিং ইভেন্টের পরামর্শ দিতে পারে৷ প্যাটার্ন গণনার মধ্যে বিষয়গত জ্ঞান অন্তর্ভুক্ত করা একটি জটিল কাজ কারণ এটির জন্য ডোমেন বিশেষজ্ঞদের কাছ থেকে যথেষ্ট পরিমাণে পূর্ববর্তী ডেটার প্রয়োজন হয়৷

প্যাটার্ন আবিষ্কারের টাস্কে পক্ষপাতদুষ্ট জ্ঞানকে অন্তর্ভুক্ত করার জন্য নিচের কয়েকটি পন্থা রয়েছে যা নিম্নরূপ -

ভিজ্যুয়ালাইজেশন - এই পদ্ধতির জন্য একটি ব্যবহারকারী-বান্ধব পরিবেশ প্রয়োজন যাতে লুপে মানব ব্যবহারকারী বজায় রাখা যায়। এটি ডোমেন বিশেষজ্ঞদের আবিষ্কৃত নিদর্শনগুলি সম্পাদন এবং পরীক্ষা করে ডেটা মাইনিং সিস্টেমের সাথে সংযোগ করতে সক্ষম করে৷

টেমপ্লেট-ভিত্তিক পদ্ধতি - এই পদ্ধতি ব্যবহারকারীদের মাইনিং অ্যালগরিদম দ্বারা অনুলিপি করা নিদর্শনগুলির ধরণকে সীমাবদ্ধ করতে সক্ষম করে৷ সমস্ত নিষ্কাশিত নিয়মগুলি নথিভুক্ত করার পরিবর্তে, শুধুমাত্র সেই নিয়মগুলি যেগুলির জন্য একটি ব্যবহারকারী-নির্দিষ্ট টেমপ্লেট প্রয়োজন ব্যবহারকারীদের কাছে পুনরুদ্ধার করা হয়৷

বিষয়ভিত্তিক আকর্ষণীয়তার পরিমাপ − একটি বিষয়গত পরিমাপ ডোমেন ডেটার উপর ভিত্তি করে উপস্থাপন করা যেতে পারে যার মধ্যে ধারণা শ্রেণিবিন্যাস বা উপাদানের লাভ সীমা অন্তর্ভুক্ত। পরিমাপটি প্যাটার্ন ফিল্টার করতে ব্যবহার করা যেতে পারে যেগুলি অ্যাক্সেসযোগ্য এবং অ-কার্যযোগ্য৷


  1. C5 প্রুনিং অ্যালগরিদম কি?

  2. টেম্পোরাল ডেটা মাইনিং কি?

  3. ডেটা গুদামের ডিজাইন কি?

  4. স্টেগানোগ্রাফির ব্যবহার কী?