কম্পিউটার

কেন ডেটা মাইনিংয়ে সমর্থন এবং আস্থা ব্যবহার করবেন?


সমর্থন একটি উল্লেখযোগ্য পরিমাপ কারণ খুব কম সমর্থন আছে এমন একটি নিয়ম ঘটনাক্রমে সহজেই উপস্থিত হতে পারে। একটি কম সমর্থন নিয়ম একটি ব্যবসায়িক দৃষ্টিকোণ থেকে ক্লান্তিকর হতে পারে কারণ এটি এমন আইটেমগুলিকে উন্নত করা লাভজনক হতে পারে না যা ব্যবহারকারীরা খুব কমই একসাথে ক্রয় করে৷

একটি অ্যাসোসিয়েশন নিয়ম হল X→Y ফর্মের একটি অন্তর্নিহিত বিবরণ যেখানে X এবং Y হল বিচ্ছিন্ন আইটেমসেট, যেমন, $\mathrm{X\cap\:Y=\phi}$। একটি অ্যাসোসিয়েশন নিয়মের স্থায়িত্ব তার সমর্থন এবং আস্থার পরিপ্রেক্ষিতে গণনা করা যেতে পারে। সমর্থন সিদ্ধান্ত নেয় কিভাবে একটি নিয়ম প্রদান করা যায় যা একটি প্রদত্ত ডেটা সেটে অ্যাক্সেসযোগ্য, যখন আত্মবিশ্বাস সিদ্ধান্ত নেয় যে X-এর অন্তর্ভুক্ত লেনদেনে Y-এর আইটেমগুলি কত ঘন ঘন ঘটবে৷

আত্মবিশ্বাস একটি নিয়ম দ্বারা উত্পাদিত অনুমানের নির্ভুলতা পরিমাপ করে। একটি প্রদত্ত নিয়ম ফর্ম X→Y-এর জন্য, আত্মবিশ্বাস যত বড় হবে, X অন্তর্ভুক্ত লেনদেনে Y-এর উপস্থিত থাকা তত বেশি গ্রহণযোগ্য। কনফিডেন্স Y প্রদত্ত X-এর শর্তসাপেক্ষ সম্ভাব্যতার একটি অনুমানকেও সমর্থন করে।

অ্যাসোসিয়েশন বিশ্লেষণ ফলাফল যত্ন সহকারে কার্যকর করা আবশ্যক. একটি সংঘের নিয়ম দ্বারা উত্পাদিত অনুমান মূলত কার্যকারণকে বোঝায় না। বরং এটি নিয়মের পূর্ববর্তী এবং ফলস্বরূপ উপাদানগুলির মধ্যে একটি শক্তিশালী সহ-আদর্শ সম্পর্কের পরামর্শ দেয়। কার্যকারণে তথ্যের কার্যকারণ এবং প্রভাবের বৈশিষ্ট্য সম্পর্কে জ্ঞানের প্রয়োজন এবং সাধারণত সময়ের সাথে সাথে উপস্থিত সম্পর্ক রয়েছে।

সমিতির নিয়ম খনির সমস্যা নিম্নরূপ বিবৃত করা যেতে পারে -

অ্যাসোসিয়েশন রুল ডিসকভারি − T লেনদেনের একটি সেট দেওয়া, সমর্থন ≥ minsup এবং confidence ≥ minconf সহ কিছু নিয়ম আবিষ্কার করুন, যেখানে minsup এবং minconf হল সমতুল্য সমর্থন এবং আত্মবিশ্বাসের থ্রেশহোল্ড৷

মাইনিং অ্যাসোসিয়েশনের নিয়মগুলির জন্য একটি পাশবিক শক্তি পদ্ধতি হল প্রতিটি প্রযোজ্য নিয়মের জন্য সমর্থন এবং আস্থার গণনা করা। এই পদ্ধতিটি অত্যন্ত ব্যয়বহুল কারণ একটি ডেটা সেট থেকে অনুলিপি করা যেতে পারে এমন অনেক নিয়ম রয়েছে।

অ্যাসোসিয়েশন রুল মাইনিং অ্যালগরিদম বাস্তবায়ন বাড়ানোর দিকে একটি মূল পদক্ষেপ হল সমর্থন এবং আস্থার প্রয়োজনীয়তাগুলিকে দ্বিগুণ করা। যদি আইটেমসেটটি বিজোড় হয়, তাই ছয়টি প্রার্থীর নিয়ম তাদের আস্থার মান গণনা না করেই সরাসরি ছাঁটাই করা যেতে পারে।

এইভাবে, বিভিন্ন অ্যাসোসিয়েশন রুল মাইনিং অ্যালগরিদমের অফশোর একটি সাধারণ কৌশল হল সমস্যাগুলিকে দুটি প্রধান সাবটাস্কে বিভক্ত করা -

ঘন ঘন আইটেমসেট জেনারেশন - উদ্দেশ্য হল কিছু আইটেমসেট আবিষ্কার করা যার জন্য একটি থ্রেশহোল্ড প্রয়োজন। এই আইটেমসেটগুলিকে ঘন ঘন আইটেমসেট বলা হয়৷

শাসন প্রজন্ম - উদ্দেশ্য হল পূর্ববর্তী ধাপে আবিষ্কৃত ঘন ঘন আইটেমসেটগুলি থেকে কিছু উচ্চ-বিশ্বাসের নিয়ম বের করা। এই নিয়মগুলি শক্তিশালী নিয়ম হিসাবে পরিচিত। ঘন ঘন আইটেম সেট তৈরির জন্য গণনামূলক প্রয়োজনীয়তাগুলি নিয়ম তৈরির তুলনায় প্রায়শই বেশি ব্যয়বহুল৷


  1. আমরা কেন তথ্য নিরাপত্তায় গ্রুপ, রিং এবং ফিল্ড ব্যবহার করি?

  2. কেন আমরা আমদানি * এবং তারপর TKinter এ ttk ব্যবহার করি?

  3. কিভাবে ZFS স্ন্যাপশট এবং ক্লোন ব্যবহার করবেন

  4. কিভাবে (এবং কেন) উইন্ডোজ স্যান্ডবক্স ব্যবহার করবেন