PROCLUS এর অর্থ হল প্রজেক্টেড ক্লাস্টারিং। এটি একটি সাধারণ মাত্রা-হ্রাস সাবস্পেস ক্লাস্টারিং কৌশল। অর্থাৎ, স্বতন্ত্র-মাত্রিক স্থান থেকে শুরু না করে, এটি উচ্চ-মাত্রিক বৈশিষ্ট্যের এলাকায় ক্লাস্টারগুলির একটি আসল অনুমান খুঁজে বের করার মাধ্যমে শুরু হয়৷
প্রতিটি মাত্রা প্রতিটি ক্লাস্টারের জন্য একটি ওজন তৈরি করা হয়, এবং ক্লাস্টারগুলিকে পুনরায় তৈরি করতে রিফ্রেশ করা ওজনগুলি পরবর্তী পুনরাবৃত্তিতে ব্যবহার করা হয়৷ এটি কিছু সুবিধাজনক মাত্রিকতার সমস্ত সাবস্পেসে ঘন এলাকাগুলির অন্বেষণের দিকে নিয়ে যায় এবং নিম্ন মাত্রিকতার প্রক্ষিপ্ত মাত্রাগুলিতে বিপুল সংখ্যক ওভারল্যাপড ক্লাস্টার তৈরিতে বাধা দেয়৷
প্রক্লাস ক্লারেন্স-এ ব্যবহৃত একটি হিল-ক্লাইম্বিং ফেজ দ্বারা মেডয়েডের সেরা গ্রুপ আবিষ্কার করে, কিন্তু প্রজেক্টেড ক্লাস্টারিংয়ের সাথে পরিচালনা করার জন্য সাধারণীকৃত। এটি ম্যানহাটন সেগমেন্টাল দূরত্ব নামে পরিচিত একটি দূরত্ব পরিমাপ গ্রহণ করে, যা উপযুক্ত মাত্রার একটি গ্রুপে ম্যানহাটনের দূরত্ব।
প্রোক্লাস অ্যালগরিদম তিনটি প্রক্রিয়া অন্তর্ভুক্ত করে:প্রাথমিককরণ, পুনরাবৃত্তি এবং ক্লাস্টার পরিমার্জন। প্রারম্ভিক প্রক্রিয়ায়, একে অপরের থেকে অনেক দূরে থাকা আসল মেডয়েডগুলির একটি সেট বেছে নেওয়ার জন্য এটি একটি লোভী অ্যালগরিদম প্রয়োজন যাতে প্রতিটি ক্লাস্টারকে নির্বাচিত সেটে ন্যূনতম একটি বস্তু দ্বারা সংজ্ঞায়িত করা হয়৷
এটি তৈরি করতে প্রয়োজনীয় একাধিক ক্লাস্টারের সমানুপাতিক ডেটা পয়েন্টগুলির একটি এলোমেলো নমুনা নির্বাচন করতে পারে এবং তারপর পরবর্তী প্রক্রিয়ার জন্য আরও ছোট চূড়ান্ত উপসেট পেতে লোভী অ্যালগরিদম ব্যবহার করে৷
পুনরাবৃত্তি প্রক্রিয়াটি এই হ্রাসকৃত সেট (মেডয়েডগুলির) থেকে k মেডয়েডের একটি র্যান্ডম সেট বেছে নেয় এবং ক্লাস্টারিং বাড়ানো হলে এলোমেলোভাবে নতুন মেডয়েড নির্বাচন করে "খারাপ" মেডয়েডগুলি পুনরুদ্ধার করে৷
প্রতিটি মেডয়েডের জন্য, মাত্রার একটি গ্রুপ নির্বাচন করা হয় যার গড় দূরত্ব গাণিতিক প্রত্যাশার তুলনায় ছোট। মেডয়েডের সাথে সম্পর্কিত মোট মাত্রার সংখ্যা k×l হওয়া উচিত, যেখানে l হল একটি ইনপুট প্যারামিটার যা ক্লাস্টার সাবারিয়ার গড় মাত্রা বেছে নেয়।
পরিমার্জন প্রক্রিয়া আবিষ্কৃত ক্লাস্টারগুলির উপর নির্ভর করে প্রতিটি medoid-এর জন্য নতুন মাত্রা গণনা করে, medoids-এ পয়েন্ট পুনরায় বরাদ্দ করে এবং আউটলায়ার মুছে দেয়। PROCLUS প্রদর্শন করে যে পদ্ধতিটি কার্যকর এবং উচ্চ-মাত্রিক ক্লাস্টারগুলি আবিষ্কার করার ক্ষেত্রে মাপযোগ্য৷
CLIQUE এর বিপরীতে, যা অনেকগুলি ওভারল্যাপ করা ক্লাস্টারকে আউটপুট করে, PROCLUS পয়েন্টগুলির অ-ওভারল্যাপড পার্টিশন খুঁজে পায়। আবিষ্কৃত ক্লাস্টারগুলি উচ্চ-মাত্রিক ডেটা আরও ভালভাবে বুঝতে পারে এবং অন্যান্য পরবর্তী বিশ্লেষণগুলিকে সমর্থন করে৷
CLIQUE অগত্যা সর্ববৃহৎ মাত্রার সাবস্পেসগুলি আবিষ্কার করে যেমন উচ্চ-ঘনত্বের ক্লাস্টারগুলি সেই সাবস্পেসগুলিতে চলতে থাকে৷ এটি ইনপুট বস্তুর ক্রমানুসারে প্রতিক্রিয়াশীল নয় এবং কিছু ক্যানোনিকাল ডেটা বিতরণের ভান করে না। এটি ইনপুটের আকারের সাথে রৈখিকভাবে স্কেল করে এবং ডেটার একাধিক মাত্রা উন্নত হওয়ার কারণে সর্বোত্তম মাপযোগ্যতা রয়েছে৷