কম্পিউটার

CURE কি?


CURE প্রতিনিধি ব্যবহার করে ক্লাস্টারিং প্রতিনিধিত্ব করে। এটি একটি ক্লাস্টারিং অ্যালগরিদম যা একটি পদ্ধতি তৈরি করতে একাধিক কৌশল ব্যবহার করে যা অ-গোলাকার আর্কিটেকচার এবং অ-ইউনিফর্ম মাপের উচ্চ ডেটা সেট, আউটলিয়ার এবং ক্লাস্টারগুলি পরিচালনা করতে পারে। CURE ক্লাস্টার থেকে কয়েকটি প্রতিনিধি পয়েন্ট ব্যবহার করে একটি ক্লাস্টার সংজ্ঞায়িত করে।

এই পয়েন্টগুলি ক্লাস্টারের জ্যামিতি এবং আর্কিটেকচার গ্রহণ করবে। প্রথম প্রতিনিধি বিন্দুটি ক্লাস্টারের মাঝখানে থেকে সবচেয়ে দূরে বিন্দু হিসাবে নির্বাচিত হয়, বাকি বিন্দুগুলি নির্বাচন করা হয় যাতে তারা পূর্ববর্তী নির্বাচিত সমস্ত বিন্দু থেকে সবচেয়ে দূরে থাকে। এই পদ্ধতিতে, প্রতিনিধি পয়েন্টগুলি সহযোগীভাবে ভালভাবে বিতরণ করা হয়। নির্বাচিত একাধিক পয়েন্ট একটি প্যারামিটার, কিন্তু এটি আবিষ্কৃত হয়েছে যে 10 বা তার বেশি মান ভালভাবে পরিচালিত হয়৷

যেহেতু প্রতিনিধি পয়েন্টগুলি নির্বাচন করা হয়েছে, সেগুলি কেন্দ্রের দিকে একটি ফ্যাক্টর দ্বারা হ্রাস পেয়েছে,𝛼৷ এই সমর্থনটি বহিরাগতদের প্রভাবকে মাঝারি করে, যা সাধারণত কেন্দ্র থেকে আরও দূরে থাকে এবং তাই, আরও সঙ্কুচিত হয়। উদাহরণস্বরূপ, কেন্দ্র থেকে 10 ইউনিটের দূরত্বের একটি প্রতিনিধি বিন্দু 3 ইউনিট দ্বারা পরিবর্তিত হতে পারে (𝛼 =0.7 এর জন্য), যেখানে 1 ইউনিটের দূরত্বে একটি প্রতিনিধি বিন্দু 0.3 ইউনিট পরিবর্তন করতে পারে।

CURE ক্লাস্টারিং পর্যায়ে দুটি একাধিক পয়েন্টে বহিরাগত অপসারণ করার জন্য শ্রেণিবদ্ধ ক্লাস্টারিং প্রক্রিয়ার নির্দিষ্ট বৈশিষ্ট্যগুলির সুবিধা নেয়। প্রথমত, যদি একটি ক্লাস্টার ধীরে ধীরে বাড়তে থাকে, তাহলে এর অর্থ হতে পারে যে এতে বেশিরভাগই আউটলায়ার রয়েছে, কারণ সংজ্ঞা অনুসারে, আউটলায়াররা অন্যদের থেকে অনেক দূরে এবং প্রায়শই বিভিন্ন পয়েন্টের সাথে মিলিত হয় না।

CURE-তে, বহিঃপ্রকাশের এই প্রথম পদ্ধতিটি সাধারণত প্রদর্শিত হয় যখন ক্লাস্টারের সংখ্যা পয়েন্টের প্রাথমিক সংখ্যার 1/3 হয়। আউটলিয়ার নির্মূলের দ্বিতীয় পদ্ধতিটি প্রদর্শিত হয় যখন একাধিক ক্লাস্টার K এর ক্রম অনুসারে, একাধিক কাঙ্ক্ষিত ক্লাস্টার। এই মুহুর্তে, ছোট ক্লাস্টারগুলি সরানো হয়৷

কারণ CURE এর সবচেয়ে খারাপ ক্ষেত্রে জটিলতা হল $\mathrm{O(m^2logm)}$, এটি উচ্চ ডেটা সেটে সঠিকভাবে ব্যবহার করা যাবে না। CURE ক্লাস্টারিং পদ্ধতির গতি বাড়ানোর জন্য দুটি পদ্ধতি ব্যবহার করে। প্রথম পদ্ধতিটি একটি এলোমেলো নমুনা নেয় এবং নমুনাযুক্ত ডেটা পয়েন্টগুলিতে শ্রেণিবদ্ধ ক্লাস্টারিং প্রয়োগ করে। এটি একটি শেষ পাস দ্বারা অনুসরণ করা হয় যা ডেটা সেটের প্রতিটি অবশিষ্ট পয়েন্ট তৈরি করে ক্লাস্টারগুলির একটিতে নিকটতম প্রতিনিধি বিন্দু সহ ক্লাস্টার নির্বাচন করে৷

কিছু ক্ষেত্রে, ক্লাস্টারিংয়ের জন্য প্রয়োজনীয় নমুনা বেশি এবং একটি সেকেন্ড আরও কৌশল প্রয়োজন। এই পরিস্থিতিতে, CURE নমুনা ডেটা পার্টিশন করে এবং প্রতিটি পার্টিশনের পয়েন্টগুলি ক্লাস্টার করে। এই প্রাক-ক্লাস্টারিং পদ্ধতিটি মধ্যবর্তী ক্লাস্টারগুলির একটি ক্লাস্টারিং এবং একটি শেষ পাস দ্বারা অনুসরণ করা হয় যা একটি ক্লাস্টারে সেট করা ডেটার প্রতিটি পয়েন্ট তৈরি করে৷


  1. রক কি?

  2. প্রক্লাস কি?

  3. JDBC এ সংরক্ষণ পয়েন্ট কি? ব্যাখ্যা করা?

  4. Google মানচিত্রের জন্য স্থানীয় গাইড কি?