মাল্টিরিলেশনাল ক্লাস্টারিং হল ডাটা অবজেক্টকে ক্লাস্টারের একটি গ্রুপে ভাগ করার পর্যায়, একাধিক সম্পর্কের ডেটা ব্যবহার করে তাদের সাদৃশ্যের উপর নির্ভর করে। ক্রসক্লাস ব্যবহারকারীর নির্দেশিকা সহ ক্রস-রিলেশনাল ক্লাস্টারিং প্রতিনিধিত্ব করে। এটি মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের জন্য একটি অ্যালগরিদম যা বিশ্লেষণ করে যে কীভাবে ক্লাস্টারিং এবং টিপল আইডি প্রচারে ব্যবহারকারীর নির্দেশিকা ব্যবহার করতে হয় যাতে শারীরিক যোগদান প্রতিরোধ করা যায়।
মাল্টি-রিলেশনাল ক্লাস্টারিংয়ের প্রধান চ্যালেঞ্জ হল একাধিক সম্পর্কের মধ্যে বেশ কয়েকটি বৈশিষ্ট্য রয়েছে এবং সাধারণত তাদের মধ্যে শুধুমাত্র একটি ছোট ক্ষেত্র একটি নির্দিষ্ট ক্লাস্টারিং কাজের জন্য প্রাসঙ্গিক।
এটি শিক্ষার্থীদের ক্লাস্টার করতে পারে, গুণাবলী শিক্ষার্থীদের দ্বারা নেওয়া কোর্স, শিক্ষার্থীদের প্রকাশনা, উপদেষ্টা এবং শিক্ষার্থীদের গবেষণা দল ইত্যাদি সহ তথ্যের বিভিন্ন উপাদানকে কভার করে।
একজন ব্যবহারকারী সাধারণত ডেটার একটি নির্দিষ্ট উপাদান ব্যবহার করে ছাত্রদের ক্লাস্টারিং করতে আগ্রহী হন (যেমন, তাদের গবেষণার ক্ষেত্র অনুসারে ছাত্রদের ক্লাস্টারিং)। ব্যবহারকারীরা তাদের প্রয়োজনীয় অ্যাপ্লিকেশন এবং ডেটা শব্দার্থবিদ্যা সম্পর্কে আরও ভালভাবে উপলব্ধি করতে পারে। এইভাবে, একটি সাধারণ প্রশ্নের আকারে একজন ব্যবহারকারীর নির্দেশিকা, উচ্চমাত্রিক বহু-সম্বন্ধীয় ক্লাস্টারিংয়ের কার্যকারিতা এবং গুণমান উন্নত করতে ব্যবহার করা যেতে পারে৷
CrossClus ব্যবহারকারীর প্রশ্নগুলি গ্রহণ করে যাতে একটি লক্ষ্য সম্পর্ক এবং এক বা একাধিক প্রাসঙ্গিক বৈশিষ্ট্য অন্তর্ভুক্ত থাকে, যা ব্যবহারকারীর ক্লাস্টারিং লক্ষ্যকে সংজ্ঞায়িত করে। মাল্টি-রিলেশনাল ক্লাস্টারিং প্রক্রিয়ায়, বিভিন্ন সম্পর্ক জুড়ে প্রাসঙ্গিক বৈশিষ্ট্যগুলি অনুসন্ধান করতে ক্রসক্লাস প্রয়োজন৷
CrossClus অনুসন্ধান পর্বে দুটি প্রধান চ্যালেঞ্জ মোকাবেলা করা উচিত. প্রথমত, লক্ষ্য সম্পর্ক, Rt , সাধারণত প্রতিটি নন-টার্গেট রিলেশনের সাথে যোগ দিতে পারে, R, বিভিন্ন যোগদানের পথের মাধ্যমে, এবং R-এর প্রতিটি বৈশিষ্ট্য একটি বহু সম্পর্কীয় বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে।
এই বৃহৎ সার্চ স্পেসে যেকোনো ধরনের সম্পূর্ণ অনুসন্ধান বাস্তবায়ন করা অপ্রাপ্য। দ্বিতীয়ত, বিপুল সংখ্যক বৈশিষ্ট্যের মধ্যে, কিছু ব্যবহারকারীর প্রশ্নের সাথে প্রাসঙ্গিক যেখানে কিছু অপ্রাসঙ্গিক (যেমন, একজন শিক্ষার্থীর সহপাঠীর ব্যক্তিগত ডেটা)।
CrossClus সার্চ ফেজ সীমাবদ্ধ করা উচিত. এটিকে একটি গ্রাফ হিসাবে রিলেশনাল স্কিমা হিসাবে বিবেচনা করা যেতে পারে, যার সাথে অ্যাসোসিয়েশনগুলি নোড এবং সংযোগগুলি প্রান্তগুলি। এটি একটি হিউরিস্টিক পদ্ধতি গ্রহণ করে, যা ব্যবহারকারী-সংজ্ঞায়িত বৈশিষ্ট্য থেকে অনুসন্ধান শুরু করে এবং তারপরে বর্তমান বৈশিষ্ট্যগুলির আশেপাশে উপকারী বৈশিষ্ট্যগুলির জন্য বারবার অনুসন্ধান করে। এই পদ্ধতিতে, এটি ধীরে ধীরে সংযুক্ত সম্পর্কের জন্য অনুসন্ধানের সুযোগ তৈরি করে, তবে এলোমেলো দিকগুলিতে বেশিদূর যাবে না।
ক্লাস্টার টার্গেট টিপলকে কীভাবে অ্যাট্রিবিউট করে তা CrossClus দেখে। প্রাসঙ্গিক বৈশিষ্ট্যগুলি ব্যবহারকারী-সংজ্ঞায়িত বৈশিষ্ট্যগুলির সাথে তাদের সম্পর্কের উপর নির্ভর করে নির্বাচিত হয়৷ যদি দুটি বৈশিষ্ট্য ক্লাস্টার টিপল খুব আলাদাভাবে থাকে, তবে তাদের মিল কম এবং তাদের যুক্ত হওয়া অসম্ভব। যদি তারা একইভাবে ক্লাস্টার টিপল করে, তবে তাদের অবশ্যই সম্পর্কিত বলে বিবেচিত হবে।