লিঙ্ক মাইনিং এর চ্যালেঞ্জ কি?

লিঙ্ক মাইনিংয়ের বেশ কয়েকটি চ্যালেঞ্জ রয়েছে যা নিম্নরূপ -

লজিক্যাল বনাম পরিসংখ্যান নির্ভরতা − গ্রাফ লিঙ্ক স্ট্রাকচারে দুই ধরনের নির্ভরতা থাকে (বস্তুগুলির মধ্যে যৌক্তিক সম্পর্ককে উপস্থাপন করে) এবং সম্ভাব্য নির্ভরতা (পরিসংখ্যানগত সম্পর্ককে উপস্থাপন করে, যেমন বস্তুর বৈশিষ্ট্যগুলির মধ্যে পারস্পরিক সম্পর্ক যেখানে, সাধারণত, এই ধরনের বস্তুগুলি যৌক্তিকভাবে সম্পর্কিত)।

এই নির্ভরতাগুলির সুসংগত পরিচালনাও বহু-সম্বন্ধীয় ডেটা মাইনিংয়ের জন্য একটি চ্যালেঞ্জ, যেখানে খনন করা ডেটা একাধিক টেবিলে বিদ্যমান। এটি বস্তুর মধ্যে বিভিন্ন সম্ভাব্য যৌক্তিক সম্পর্ক অনুসন্ধান করা উচিত, উপরন্তু বৈশিষ্ট্যগুলির মধ্যে সম্ভাব্য নির্ভরতার উপর আদর্শ অনুসন্ধান। এটি একটি বিশাল অনুসন্ধান এলাকা নেয়, যা একটি যুক্তিসঙ্গত গাণিতিক মডেল খুঁজে পেতে আরও জটিল করে তোলে। ইন্ডাকটিভ লজিক প্রোগ্রামিং-এ বিকশিত পদ্ধতিগুলি এখানে প্রয়োগ করা যেতে পারে, যা যৌক্তিক সম্পর্কের উপর অনুসন্ধানে ফোকাস করে৷
বৈশিষ্ট্য নির্মাণ - লিঙ্ক-ভিত্তিক শ্রেণীবিভাগে, এটি একটি বস্তুর বৈশিষ্ট্য এবং এটির সাথে সংযুক্ত বস্তুর বৈশিষ্ট্যগুলি বিবেচনা করতে পারে। উপরন্তু, লিঙ্ক এছাড়াও বৈশিষ্ট্য থাকতে পারে. বৈশিষ্ট্য নির্মাণের উদ্দেশ্য হল এই বৈশিষ্ট্যগুলিকে সংজ্ঞায়িত করে একটি একক বৈশিষ্ট্য তৈরি করা। এতে বৈশিষ্ট্য নির্বাচন এবং বৈশিষ্ট্য সমষ্টি থাকতে পারে। বৈশিষ্ট্য নির্বাচন, শুধুমাত্র সবচেয়ে বৈষম্যমূলক বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়.
দৃষ্টান্ত বনাম ক্লাস - এটি নির্দেশ করে যে মডেলটি স্পষ্টভাবে ব্যক্তি বা ব্যক্তিদের শ্রেণী (জেনেরিক বিভাগ) নির্দেশ করে কিনা। প্রাক্তন মডেলের সুবিধা হল এটি উচ্চ সম্ভাবনার সাথে নির্দিষ্ট ব্যক্তিদের সংযোগ করতে ব্যবহার করা যেতে পারে। পরের মডেলটির একটি সুবিধা হল যে এটি বিভিন্ন ব্যক্তির সাথে নতুন পরিস্থিতিতে সাধারণীকরণ করতে ব্যবহার করা যেতে পারে।
লেবেলযুক্ত এবং লেবেলবিহীন ডেটার কার্যকর ব্যবহার - শেখার একটি সাম্প্রতিক কৌশল হল লেবেলযুক্ত এবং লেবেলবিহীন উভয় ডেটার মিশ্রণকে অন্তর্ভুক্ত করা। লেবেলবিহীন ডেটা অবজেক্ট অ্যাট্রিবিউট ডিস্ট্রিবিউশনকে সমর্থন করতে পারে। লেবেলবিহীন (পরীক্ষা) ডেটার মধ্যে লিঙ্কগুলি আমাদের লিঙ্কযুক্ত বস্তুর বৈশিষ্ট্যগুলি ব্যবহার করার অনুমতি দেয়। লেবেলযুক্ত (প্রশিক্ষণ) ডেটা এবং লেবেলবিহীন (পরীক্ষা) ডেটার মধ্যে লিঙ্কগুলি নির্ভরতাকে প্ররোচিত করে যা আরও সঠিক অনুমান তৈরি করতে সাহায্য করতে পারে৷
লিঙ্কের পূর্বাভাস - লিঙ্ক ভবিষ্যদ্বাণীতে একটি চ্যালেঞ্জ হল যে বস্তুর মধ্যে একটি নির্দিষ্ট লিঙ্কের পূর্ব সম্ভাবনা সাধারণত অত্যন্ত কম। একটি নেটওয়ার্কে নোডের নৈকট্য বিশ্লেষণের জন্য বিভিন্ন ব্যবস্থার উপর ভিত্তি করে পূর্বাভাস লিঙ্ক করার বিভিন্ন পদ্ধতি রয়েছে। সম্ভাব্য মডেলগুলিও প্রস্তাবিত হয়েছে। বিশাল ডেটা সেটের জন্য, এটি একটি উচ্চ স্তরে লিঙ্কগুলিকে মডেল করতে আরও দক্ষ হতে পারে৷
ক্লোজড বনাম ওপেন-ওয়ার্ল্ড অনুমান − অধিকাংশ ঐতিহ্যবাহী পন্থা অনুমান করে যে আমরা ডোমেনের সমস্ত সম্ভাব্য সত্তা জানি। এই "বন্ধ বিশ্ব" অনুমান বাস্তব বিশ্বের অ্যাপ্লিকেশনে অবাস্তব। এই এলাকায় কাজ করার সাথে সম্পর্কযুক্ত কাঠামোর উপর সম্ভাব্যতা বন্টন সংজ্ঞায়িত করার জন্য একটি ভাষার প্রবর্তন জড়িত যেটিতে বেশ কয়েকটি বস্তু রয়েছে।