কম্পিউটার

ডেটা মাইনিংয়ে সীমাবদ্ধতার শ্রেণীকরণ কী?


ঘন ঘন আইটেমসেট জেনারেশন ফেজে সার্চ এরিয়া কমাতে সীমাবদ্ধতা-ভিত্তিক অ্যালগরিদমের সীমাবদ্ধতা প্রয়োজন (অ্যাসোসিয়েশন নিয়ম তৈরির ধাপটি সম্পূর্ণ অ্যালগরিদমের মতোই সঠিক)।

সীমাবদ্ধতার গুরুত্ব ভালভাবে সংজ্ঞায়িত করা হয়েছে এবং তারা শুধুমাত্র অ্যাসোসিয়েশনের নিয়ম তৈরি করে যা গ্রাহকদের কাছে আকর্ষণীয়। পদ্ধতিটি বেশ তুচ্ছ এবং নিয়মের ক্ষেত্র হ্রাস করা হয়েছে যার ফলে অবশিষ্ট নিয়মগুলি সীমাবদ্ধতাগুলি ব্যবহার করে৷

তিন ধরনের সীমাবদ্ধতা রয়েছে যা নিম্নরূপ -

দৃষ্টান্তে সীমাবদ্ধতা − দৃষ্টান্তগুলির একটি সীমাবদ্ধতা সংজ্ঞায়িত করে যে কীভাবে একটি জোড়া বা দৃষ্টান্তের একটি সেটকে ক্লাস্টার বিশ্লেষণে গোষ্ঠীবদ্ধ করা আবশ্যক৷ এই বিভাগ থেকে দুটি ধরণের সীমাবদ্ধতা রয়েছে যেমন −

  • অবশ্যই লিঙ্ক সীমাবদ্ধতা − যদি দুটি অবজেক্ট x এবং y-এ একটি আবশ্যক-লিঙ্ক সীমাবদ্ধতা সংজ্ঞায়িত করা হয়, তাই ক্লাস্টার বিশ্লেষণের আউটপুটে x এবং y অবশ্যই একটি ক্লাস্টারে গোষ্ঠীভুক্ত করা উচিত। এই মাস্ট-লিঙ্ক সীমাবদ্ধতাগুলি হল ট্রানজিটিভ যেমন, মাস্ট-লিঙ্ক(x, y) এবং মাস্ট-লিঙ্ক(y,z), তারপর মাস্ট-লিঙ্ক(x,z)।

  • সীমাবদ্ধতা লিঙ্ক করতে পারে না৷ − লিঙ্ক-সংযুক্ত সীমাবদ্ধতাগুলি অবশ্যই লিঙ্কের সীমাবদ্ধতার বিপরীত। যদি দুটি অবজেক্ট, x এবং y-তে একটি সংযোগ করতে না পারে এমন সীমাবদ্ধতা সংজ্ঞায়িত করা হয়, তাই ক্লাস্টার বিশ্লেষণের আউটপুটে, x এবং y অবশ্যই কয়েকটি ক্লাস্টারের অন্তর্গত। লিঙ্ক সীমাবদ্ধতা entailed করা যাবে না. লিঙ্ক করতে না পারলে(x, y), অবশ্যই লিঙ্ক করতে হবে (x, x ) ), এবং অবশ্যই-লিঙ্ক (y, y ) ), তারপর লিঙ্ক করা যাবে না (x ) , y )।

ক্লাস্টারে সীমাবদ্ধতা - ক্লাস্টারগুলির একটি সীমাবদ্ধতা ক্লাস্টারগুলির একটি প্রয়োজনীয়তাকে সংজ্ঞায়িত করে, সম্ভবত ক্লাস্টারগুলির বৈশিষ্ট্যগুলি ব্যবহার করে৷ উদাহরণস্বরূপ, একটি সীমাবদ্ধতা একটি ক্লাস্টারে বস্তুর সর্বনিম্ন সংখ্যা, একটি ক্লাস্টারের সর্বাধিক ব্যাস, বা একটি ক্লাস্টারের আকৃতি (যেমন, একটি উত্তল) সংজ্ঞায়িত করতে পারে। ক্লাস্টারিং পদ্ধতিগুলিকে পার্টিশন করার জন্য সংজ্ঞায়িত ক্লাস্টারের সংখ্যা ক্লাস্টারগুলিতে একটি সীমাবদ্ধতা হিসাবে চিহ্নিত করা যেতে পারে।

সাদৃশ্য পরিমাপের সীমাবদ্ধতা − একটি সাদৃশ্য পরিমাপ, ইউক্লিডীয় দূরত্ব সহ, একটি ক্লাস্টার বিশ্লেষণে বস্তুর মধ্যে সাদৃশ্য গণনা করতে ব্যবহৃত হয়। বিভিন্ন অ্যাপ্লিকেশনে, ব্যতিক্রম ব্যবহার করে। সাদৃশ্য পরিমাপের একটি সীমাবদ্ধতা একটি প্রয়োজনীয়তাকে সংজ্ঞায়িত করে যা সাদৃশ্য গণনাকে অবশ্যই সম্মান করতে হবে।

উদাহরণস্বরূপ, এটি একটি প্লাজায় পরিবর্তনশীল বস্তু হিসাবে লোকেদের ক্লাস্টার করতে পারে, যখন ইউক্লিডীয় দূরত্ব দুটি বিন্দুর মধ্যে হাঁটার দূরত্ব তৈরি করতে পারে, সাদৃশ্য পরিমাপের একটি সীমাবদ্ধতা হল যে ট্র্যাজেক্টরিটি সবচেয়ে কম দূরত্ব নির্বাহ করে একটি প্রাচীর অতিক্রম করতে পারে না৷

ক্লাস্টারিং সীমাবদ্ধতাগুলিকে শ্রেণিবদ্ধ করার আরেকটি পদ্ধতি রয়েছে যা বিবেচনা করে যে সীমাবদ্ধতাগুলিকে কতটা কঠোরভাবে সম্মান করতে হবে। একটি সীমাবদ্ধতা কঠিন যদি সীমাবদ্ধতাকে ব্যাহত করে এমন একটি ক্লাস্টারিং অগ্রহণযোগ্য হয়। একটি সীমাবদ্ধতা নরম হয় যদি সীমাবদ্ধতাকে ব্যাহত করে এমন একটি ক্লাস্টারিং কাম্য না হয় তবে গ্রহণযোগ্য হয় যখন কোন ভাল সমাধান আবিষ্কার করা যায় না। নরম সীমাবদ্ধতা পছন্দ হিসাবেও পরিচিত।


  1. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  2. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?

  3. ডেটা মাইনিংয়ে আউটলায়ারের ধরন কী কী?

  4. গোপনীয়তা-সংরক্ষণের ডেটা মাইনিংয়ের পদ্ধতিগুলি কী কী?