কম্পিউটার

CLIQUE কি?


CLIQUE হল প্রথম অ্যালগরিদম যা উচ্চ-মাত্রিক এলাকায় মাত্রা-বৃদ্ধি সাবারিয়া ক্লাস্টারিংয়ের জন্য প্রজেক্ট করা হয়েছিল। ডাইমেনশন-গ্রোথ সাবরিয়া ক্লাস্টারিং-এ, ক্লাস্টারিং প্রক্রিয়া একক-মাত্রিক সাবস্পেস থেকে শুরু হয় এবং উচ্চ-মাত্রিক সাবস্পেস থেকে ঊর্ধ্বমুখী হয়।

কারণ CLIQUE প্রতিটি ডাইমেনশন যেমন গ্রিড আর্কিটেকচারকে বিভাজন করে এবং এতে অন্তর্ভুক্ত একাধিক পয়েন্টের উপর ভিত্তি করে একটি সেল ঘন কিনা তা নির্ধারণ করে। এটিকে ঘনত্ব-ভিত্তিক এবং গ্রিড-ভিত্তিক ক্লাস্টারিং পদ্ধতির একীকরণ হিসাবে দেখা যেতে পারে।

CLIQUE ক্লাস্টারিং অ্যালগরিদমের ধারণাগুলি নিম্নরূপ -

  • বহুমাত্রিক ডেটা পয়েন্টগুলির একটি বৃহৎ গোষ্ঠী দেওয়া, ডেটা এলাকাটি সাধারণত ডেটা পয়েন্টগুলির দ্বারা অভিন্নভাবে জড়িত থাকে না। CLIQUE-এর ক্লাস্টারিং স্পেসের (বা একক) বিক্ষিপ্ত এবং "জনাকীর্ণ" এলাকাকে চিনতে পারে, যার ফলে ডেটা সেটের সম্পূর্ণ বন্টন প্যাটার্ন খুঁজে পাওয়া যায়।

  • একটি ইউনিট শক্ত হয় যদি এতে অন্তর্ভুক্ত মোট ডেটা পয়েন্টের ভগ্নাংশ একটি ইনপুট মডেল প্যারামিটার অতিক্রম করে। CLIQUE-তে, একটি ক্লাস্টারকে সংযুক্ত ঘন এককের সর্বাধিক গোষ্ঠী হিসাবে উপস্থাপন করা হয়।

CLIQUE দুটি প্রক্রিয়ায় বহুমাত্রিক ক্লাস্টারিং প্রয়োগ করে যা নিম্নরূপ - প্রথম প্রক্রিয়ায়, CLIQUE ডি-ডাইমেনশনাল ডেটা এলাকাকে অ-ওভারল্যাপিং আয়তক্ষেত্রাকার ইউনিটগুলিতে বিভাজন করে, এইগুলির মধ্যে ঘন এককগুলিকে স্বীকৃতি দেয়। এটি প্রতিটি মাত্রার জন্য (1-ডিতে) সম্পন্ন হয়।

স্টুডেন্ট সার্চ স্পেস সনাক্তকরণ অ্যাসোসিয়েশন রুল মাইনিং এ ব্যবহৃত Apriori সম্পত্তির উপর নির্ভর করে। সাধারণভাবে, সম্পত্তি অনুসন্ধান এলাকায় আইটেমগুলির পূর্ব জ্ঞান ব্যবহার করে যাতে এলাকার কিছু অংশ ছাঁটাই করা যায়।

CLIQUE এর বৈশিষ্ট্য হল নিম্নরূপ:যদি একটি k-মাত্রিক একক ঘন হয়, তাই (k−1)-মাত্রিক এলাকায় এর অনুমানও। অর্থাৎ, একটি k-মাত্রিক ছাত্র ঘন একক দেওয়া হলে, যদি এটি তার (k−1) তম অভিক্ষেপ একক পরীক্ষা করতে পারে এবং এমন কিছু আবিষ্কার করতে পারে যা ঘন নয়, তবে এটি বুঝতে পারে যে kth মাত্রিক এককটিও ঘন হতে পারে না।

এইভাবে, এটি (k − 1) মাত্রিক এলাকায় পাওয়া ঘন একক থেকে k-মাত্রিক এলাকায় সম্ভাব্য বা ছাত্র ঘন একক তৈরি করতে পারে। সাধারণভাবে, অনুসন্ধান করা ফলাফলটি মূল এলাকার তুলনায় অনেক ছোট। ক্লাস্টারগুলি নির্ধারণের জন্য ঘন ইউনিটগুলি পরীক্ষা করা হয়।

দ্বিতীয় প্রক্রিয়ায়, CLIQUE প্রতিটি ক্লাস্টারের জন্য নিম্নরূপ একটি ন্যূনতম বিবরণ তৈরি করে। প্রতিটি ক্লাস্টারের জন্য, এটি সর্বাধিক এলাকা নির্ধারণ করে যা সংযুক্ত ঘন ইউনিটগুলির ক্লাস্টারকে কভার করে। এটি প্রতিটি ক্লাস্টারের জন্য একটি ন্যূনতম কভার (লজিক বিবরণ) নির্ধারণ করে।

CLIQUE অগত্যা সেইসব সাবস্পেসে বিদ্যমান উচ্চ-ঘনত্বের ক্লাস্টার সহ বৃহত্তম মাত্রিকতার সাবস্পেসগুলি আবিষ্কার করে৷ এটি ইনপুট অবজেক্টের সিরিজের প্রতি সংবেদনশীল নয় এবং কিছু ক্যানোনিকাল ডেটা বিতরণের ভান করে না। এটি ইনপুটের আকারের সাথে রৈখিকভাবে স্কেল করে এবং ডেটাতে একাধিক মাত্রা উন্নত করায় এটির সর্বোত্তম মাপযোগ্যতা রয়েছে৷


  1. নেটওয়ার্ক কি?

  2. ওয়াইড এরিয়া নেটওয়ার্ক (WAN) কি?

  3. সি ভাষায় ব্যাকস্ল্যাশ অক্ষর ধ্রুবকগুলি কী কী?

  4. পাইথন ইউনিট টেস্টিং কি?