কম্পিউটার

মাল্টি-রিলেশনাল ডেটা মাইনিং কি?


মাল্টি-রিলেশনাল ডেটা মাইনিং (MRDM) পদ্ধতি এমন ডিজাইনের জন্য অনুসন্ধান করে যাতে একটি রিলেশনাল ডাটাবেস থেকে বেশ কিছু টেবিল (সম্পর্ক) থাকে। প্রতিটি টেবিল বা সম্পর্ক একটি সত্তা বা সম্পর্ককে প্রতিনিধিত্ব করে, যা বৈশিষ্ট্যগুলির একটি সেট দ্বারা বর্ণিত। সম্পর্কের মধ্যে লিঙ্কগুলি তাদের মধ্যে সম্পর্ক দেখায়৷

প্রথাগত ডেটা মাইনিং পদ্ধতি প্রয়োগ করার একটি পদ্ধতি রয়েছে (যা অনুমান করে যে ডেটা একটি একক টেবিলে থাকে) হল প্রপোজিশনালাইজেশন, যা যোগদান এবং একত্রিতকরণ ব্যবহার করে একাধিক সম্পর্কিত ডেটাকে একটি একক ফ্ল্যাট ডেটা রিলেশনে রূপান্তর করে৷

এটি একটি বিশাল, অবাঞ্ছিত "সর্বজনীন সম্পর্ক" (সমস্ত গুণাবলী জড়িত) তৈরি করতে পারে৷ তদ্ব্যতীত, এটি ডেটাবেস ডিজাইনের লিঙ্কগুলির দ্বারা উপস্থাপিত প্রয়োজনীয় শব্দার্থিক তথ্য সহ তথ্যের ক্ষতির কারণ হতে পারে৷

মাল্টি-রিলেশনাল ডেটা মাইনিং এর লক্ষ্য হল রিলেশনাল ডেটা থেকে সরাসরি জ্ঞান আবিষ্কার করা। বিভিন্ন মাল্টি-রিলেশনাল ডেটা মাইনিং ফাংশন রয়েছে, যেমন বহুজাতিক শ্রেণীবিভাগ, ক্লাস্টারিং এবং ঘন ঘন প্যাটার্ন মাইনিং৷

মাল্টি-রিলেশনাল শ্রেণীবিভাগের সুবিধা হল একটি শ্রেণীবিভাগ মডেল তৈরি করা যা বিভিন্ন সম্পর্কের তথ্য ব্যবহার করে। মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের লক্ষ্য হল টিপলকে তাদের বৈশিষ্ট্যগুলি ব্যবহার করে ক্লাস্টারে গোষ্ঠী করা এবং সেইসাথে বিভিন্ন সম্পর্কের সাথে সম্পর্কিত টিপল। মাল্টি-রিলেশনাল ফ্রিকোয়েন্ট প্যাটার্ন মাইনিং এর লক্ষ্য বিভিন্ন সম্পর্কের মধ্যে আন্তঃসংযুক্ত আইটেম জড়িত নিদর্শন খুঁজে বের করা। বহু-সম্পর্কিক ডেটা মাইনিং এর উদ্দেশ্য এবং পদ্ধতি ব্যাখ্যা করার জন্য এটি প্রথমে বহু-সম্পর্কিক শ্রেণীবিভাগকে উদাহরণ হিসাবে ব্যবহার করতে পারে।

মাল্টি-রিলেশনাল শ্রেণীবিভাগের জন্য একটি ডাটাবেসে, একটি টার্গেট রিলেশন আছে, Rt, যার টিপলগুলি টার্গেট টিপল হিসাবে পরিচিত এবং ক্লাস লেবেলের সাথে সম্পর্কিত। অন্য সম্পর্কগুলো লক্ষ্যহীন। প্রতিটি সম্পর্কের একটি প্রাথমিক কী থাকতে পারে (যা স্বতন্ত্রভাবে সম্পর্কের টিপলগুলিকে স্বীকৃতি দেয়) এবং বেশ কয়েকটি বিদেশী কী (যেখানে একটি সম্পর্কের একটি প্রাথমিক কী অন্যটিতে বিদেশী কীটির সাথে সংযুক্ত হতে পারে)।

যদি এটি একটি দ্বি-শ্রেণীর সমস্যা বিবেচনা করতে পারে, তাহলে এটি একটি শ্রেণীকে ইতিবাচক শ্রেণী এবং অন্যটিকে নেতিবাচক শ্রেণী হিসেবে নির্বাচন করতে পারে৷ একটি সঠিক মাল্টি-রিলেশনাল ক্লাসিফায়ার তৈরির পরিষেবা হল বিভিন্ন সম্পর্কের মধ্যে প্রাসঙ্গিক বৈশিষ্ট্যগুলি খুঁজে পাওয়া যা ইতিবাচক এবং নেতিবাচক টার্গেট টিপলগুলিকে শ্রেণীবদ্ধ করতে সহায়তা করে৷

মাল্টি-রিলেশনাল শ্রেণীবিভাগের জন্য হাইপোথিসিসের সবচেয়ে জনপ্রিয় ফর্ম হল নিয়মের সেট। প্রতিটি নিয়ম হল পূর্বাভাসের একটি তালিকা (যৌক্তিক সংযোজন), একটি ক্লাস লেবেলের সাথে যুক্ত। একটি predicate একটি সম্পর্কে একটি বৈশিষ্ট্য একটি সীমাবদ্ধতা. একটি predicate প্রায়ই একটি নির্দিষ্ট যোগদান পাথ উপর ভিত্তি করে সংজ্ঞায়িত করা হয়. একটি টার্গেট টিপল একটি নিয়মকে সন্তুষ্ট করে যদি এবং শুধুমাত্র যদি এটি নিয়মের প্রতিটি পূর্বাভাসকে সন্তুষ্ট করে।


  1. ওয়েব কন্টেন্ট মাইনিং কি?

  2. ওয়েব স্ট্রাকচার মাইনিং কি?

  3. টেম্পোরাল ডেটা মাইনিং কি?

  4. স্প্যাটিওটেম্পোরাল ডেটা মাইনিং কি?