মাল্টি-রিলেশনাল ক্লাস্টারিং হল ডেটা অবজেক্টকে তাদের সাদৃশ্যের ভিত্তিতে ক্লাস্টারের একটি সেটে বিভাজন করার প্রক্রিয়া, একাধিক সম্পর্কের তথ্য ব্যবহার করে। এই বিভাগে, এটি CrossClus (ব্যবহারকারীর নির্দেশিকা সহ ক্রস-রিলেশনাল ক্লাস্টারিং) প্রবর্তন করতে পারে, মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের জন্য একটি অ্যালগরিদম যা অন্বেষণ করে যে কীভাবে ক্লাস্টারিং এবং টিপল আইডি প্রচারে ব্যবহারকারীর নির্দেশিকা ব্যবহার করতে হয় যাতে শারীরিক যোগদান এড়াতে হয়।
মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের একটি বড় চ্যালেঞ্জ হল যে বিভিন্ন সম্পর্কের মধ্যে অনেকগুলি বৈশিষ্ট্য রয়েছে এবং সাধারণত, তাদের শুধুমাত্র একটি ছোট অংশ একটি নির্দিষ্ট ক্লাস্টারিং কাজের জন্য প্রাসঙ্গিক।
কম্পিউটার বিজ্ঞান বিভাগের ডাটাবেস বিবেচনা করুন। এটি ক্লাস্টার স্টুডেন্টদের অর্ডার দিতে পারে, অ্যাট্রিবিউটগুলি তথ্যের বিভিন্ন দিক কভার করে, যেমন ছাত্রদের দ্বারা পাঠ্যক্রম, ছাত্রদের প্রকাশনা, উপদেষ্টা এবং ছাত্রদের গবেষণা দল ইত্যাদি।
একজন ব্যবহারকারী সাধারণত তথ্যের একটি নির্দিষ্ট দিক ব্যবহার করে ছাত্রদের ক্লাস্টারিং করতে আগ্রহী হন (যেমন, তাদের গবেষণার ক্ষেত্র অনুসারে ছাত্রদের ক্লাস্টারিং)। ব্যবহারকারীরা প্রায়শই তাদের অ্যাপ্লিকেশনের প্রয়োজনীয়তা এবং ডেটা শব্দার্থবিদ্যা সম্পর্কে আগে থেকেই উপলব্ধি করেন। অতএব, একটি সাধারণ প্রশ্নের কাঠামোতে auser এর ব্যবস্থাপনা, এবং উচ্চ-মাত্রিক মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের দক্ষতা এবং গুণমান উন্নত করতে ব্যবহার করা যেতে পারে।
CrossClus ব্যবহারকারীর প্রশ্নগুলি গ্রহণ করে যাতে একটি লক্ষ্য সম্পর্ক এবং এক বা একাধিক প্রাসঙ্গিক বৈশিষ্ট্য রয়েছে, যা একসাথে ব্যবহারকারীর ক্লাস্টারিং লক্ষ্য নির্দিষ্ট করে৷ CrossClus মাল্টি-রিলেশনাল অ্যাট্রিবিউট সংজ্ঞায়িত করে। একটি মাল্টি-রিলেশনাল অ্যাট্রিবিউট A' একটি যোগদান পাথ Rt দ্বারা সংজ্ঞায়িত করা হয় ⋈ R1 …. ⋈ Rk একটি বৈশিষ্ট্য Rk . Rk এর A , এবং সম্ভবত একটি সমষ্টি অপারেটর (যেমন, গড়, গণনা, সর্বোচ্চ)।
A' আনুষ্ঠানিকভাবে [A' দ্বারা প্রতিনিধিত্ব করে। যোগ পাথ, A' .attr, A' .aggr], যার মধ্যে A'। aggr ঐচ্ছিক। একটি মাল্টি-রিলেশনাল অ্যাট্রিবিউট A' হয় একটি শ্রেণীগত বৈশিষ্ট্য বা একটি সংখ্যাসূচক, Rk কিনা তার উপর নির্ভর করে . A হল শ্রেণীগত বা সংখ্যাসূচক। যদি A’ একটি শ্রেণীবদ্ধ বৈশিষ্ট্য হয়, তাহলে একটি টার্গেট tuple t, t এর জন্য। A’ Rk-এ টিপলের মধ্যে মানের বণ্টনের প্রতিনিধিত্ব করে যেগুলো টি-এর সাথে যুক্ত হতে পারে।
মাল্টি-রিলেশনাল ক্লাস্টারিং প্রক্রিয়ায়, ক্রসক্লাসকে একাধিক সম্পর্ক জুড়ে প্রাসঙ্গিক বৈশিষ্ট্য অনুসন্ধান করতে হবে। ক্রসক্লাসকে অবশ্যই অনুসন্ধান প্রক্রিয়ার মধ্যে দুটি বড় চ্যালেঞ্জ মোকাবেলা করতে হবে। প্রথমত, লক্ষ্য সম্পর্ক, Rt , সাধারণত প্রতিটি নন-টার্গেট রিলেশনের সাথে যোগ দিতে পারে, R, বিভিন্ন যোগদানের পথের মাধ্যমে, এবং R-এর প্রতিটি অ্যাট্রিবিউট একটি মাল্টি-রিলেশনাল অ্যাট্রিবিউট হিসেবে ব্যবহার করা যেতে পারে।
এই বিশাল সার্চ স্পেসে কোনো ধরনের সম্পূর্ণ অনুসন্ধান করা অসম্ভব। দ্বিতীয়ত, বিপুল সংখ্যক গুণাবলীর মধ্যে, কিছু ব্যবহারকারীর প্রশ্নের সাথে প্রাসঙ্গিক (যেমন, একজন ছাত্রের উপদেষ্টা তার গবেষণা এলাকার সাথে সম্পর্কিত), যেখানে অন্য অনেকগুলি অপ্রাসঙ্গিক (যেমন, একজন ছাত্রের সহপাঠীর ব্যক্তিগত তথ্য)।